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本 书 采 用 七 层 结构 讲解 计算 机 系统 的 核心 概念 及 软 硬 件 实现 方法 ， 关 注 基础 的 计算 概念 而 非 追 
踪 新 的 技术 进展 ， 并 且 特 别 强 调 通过 实践 培养 学 生 解决 问题 的 能 力 。 全 书 以 Pep/9 虚 拟 机 模型 贯穿 
各 章 ， 清 晰 呈现 了 各 个 抽象 层次 之 间 的 关系 ， 并 配 有 完整 的 程序 示例 和 丰富 的 习题 。 图 书 配套 网 站 
( computersystemsbook.com ) 提供 了 丰富 的 教学 资源 。 


重要 更 新 


e。Pep/9 取 代 了 前 两 版 所 用 的 虚拟 机 Pep/8。 除 了 更 新 指令 集 外 ，Pep/9 还 采用 了 内 存 映射 MO， 改 进 

了 部 分 指令 的 助 记 符 ， 并 扩展 了 MIPS 内 容 。 

高 级 语言 从 C++ 变 为 C。C 作 为 系统 编程 语言 更 为 常见 ， 而 且 也 更 加 适合 计算 机 系统 文本 ， 从 而 能 

够 更 加 精确 地 描述 内 存 模 型 。 

新 增 Intel x86 架 构 的 实现 示例 。 作 为 补充 材料 ， 这 些 示 例 取代 了 上 一 版 中 的 人 物 传记 ， 以 帮助 读者 

理解 虚拟 机 概念 与 真实 实现 的 对 应 关系 。 

。 大 量 新 主题 与 扩展 主题 。 如 用 Java 而 不 是 C++ 语言 实现 翻译 器 、 使 用 Pep/9 CPU 模拟 器 新 的 
UnitPre 和 UnitPost 特 性 等 ， 丰 富 了 全 书 内 容 。 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时间 较 短 的 现状 下 ,美国 等 发 达 国 家 在 其 计算 机 科学 . 
发 展 的 几 十 年 间 积淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 " 。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 入选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson、 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup 
Brian W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey 
D. Ullman, Abraham Silberschatz, William Stallings. Donald E. Knuth, John L. Hennessy, 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 
学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书 ”已 经 出 版 了 近 
500 个 品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ,我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 :， www.hzbook.com 
电子 邮件 : hzjsj@hzbook.com 
联系 电话 : (010) 88379604 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 ] 号 
邮政 编码 ，100037 华章 科技 图 书 出 版 中 心 
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本 书 以 计算 机 层次 结构 为 主线 ， 从 LG1 逻辑 门 层 到 App7 应 用 层 ， 内 容 涵盖 数字 逻辑 、 
计算 机 组 成 、 汇 编 语言 和 计算 机 体系 结构 等 方面 ， 主 要 包括 计算 机 组 织 结构 、 时 序 电路 、 布 
尔 代数 和 逻辑 门 、 进 程 和 存储 管理 、 信 息 表示 、 汇 编 语言 、C 语言 以 及 计算 机 系统 。 与 之 前 
的 版 本 相 比 ， 本 书 使 用 的 虚拟 机 从 Pep/8 变 成 了 Pep/9， 两 者 在 机 器 指令 集 上 存在 不 同 ， 此 
外 ，Pep/9 还 采用 了 内 存 映 射 /JO， 改 进 了 部 分 指令 的 助 记 符 ,扩展 了 MIPS 内 容 。 

本 书 内 容 翔 实 ， 着 重 于 基础 计算 概念 ， 强 调解 决 问题 ， 使 用 一 致 的 机 器 模型 ， 配 以 完整 
的 程序 示例 ， 在 理论 与 实践 相 结合 的 基础 上 ,注重 内 容 的 广度 和 深度 。 本 书 章节 结构 明晰 ， 
适用 于 相关 课程 教学 ， 在 进行 课程 设计 时 ， 可 以 根据 需要 选择 不 同 的 章节 进行 组 合 。 

感谢 机 械 工业 出 版 社 华章 公司 的 编辑 姚 蕾 ， 由 于 她 的 热心 推荐 ， 我 们 才 有 幸 翻 译 了 这 本 
优秀 的 专业 书籍 。 

在 翻译 中 我 们 秉持 认真 细致 的 态度 ， 但 是 由 于 能 力 所 限 ， 还 是 会 存在 错误 与 疏漏 ， 和 硕 望 
广大 读者 批评 指正 。 
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本 书 清晰 详尽 、 循 序 渐进 地 揭示 了 计算 机 组 成 、 汇 编 语 言 和 计算 机 体系 结构 的 核心 思想 。 
本 书 大 部 分 以 虚拟 机 Pep/9 为 基础 ， 该 虚拟 机 用 于 讲解 经 典 冯 “' 诺 依 曼 机 器 的 基本 概念 。 这 
种 方式 的 优点 是 ， 既 教授 了 计算 机 科学 的 核心 概念 ， 又 不 会 与 相关 课程 的 许多 无 关 细节 纠缠 
不 清 。 该 方式 还 为 学 生 葛 定 了 基础 ， 鼓 励 他 们 思考 计算 机 科学 的 基本 主题 。 本 书 的 范围 也 比 
较 广 泛 ， 重点 强调 了 与 硬件 及 其 相关 软件 的 处 理 有 关 但 却 少 有 提 及 的 计算 机 科学 主题 。 


内 容 一 览 


计算 机 运行 于 多 个 抽象 屋 ， 高 抽象 层 上 的 编程 只 
是 其 中 的 一 部 分 。 本 书 以 图 P-1 所 示 的 分 层 结构 为 基 
础 ， 提 出 了 计算 机 系统 的 统一 概念 。 

按照 图 P-1 的 层次 结构 ， 本 书 分 为 七 个 部 分 : 

App7 & 应 用 

HOL6 层 高 级 语言 

ISA3 层 指令 集 架构 

Asmb5 & 汇编 

OS4 & 操作 系统 

LGI 层 还 辑 门 

Mc2 & 微 代 码 





用 文字 描述 时 通常 是 按照 从 上 到 下 的 顺序 ， 从 最 
高 层 到 最 低层 。 把 ISA3 层 放 在 Asmb5 层 之 前 ， 以 及 
把 LG1 层 放 在 Mc2 层 之 前 讨论 是 为 了 教学 目的 。 对 这 
两 个 特例 来 说 ,暂时 将 顺序 变 为 从 下 往 上 会 更 加 自然 一 些 ， 因 为 这 样 一 来 在 构建 高 层 时 可 以 
使 用 低层 模块 。 

App7 层 。App7 层 是 关于 应 用 程序 的 独立 一 章 ， 叙述 了 抽象 层次 的 思想 与 二 进 制 信息 ， 
并 为 本 书 其 他 章节 搭建 了 框架 。 这 一 章 还 以 典型 计算 机 应 用 程序 示例 的 方式 描述 了 一 些 关 系 
数据 库 的 概念 。 

HOL6 Æo HOL6 层 也 是 一 章 ， 回 顾 了 C 编程 语言 。 这 一 章 假设 学 生 已 经 学 习 过 一 些 命 
令 式 语言 ， 比 如 Java 或 Python ， 不 一 定 是 C。 如 果 必 要 的 话 ， 指 导 老 师 可 以 轻易 地 把 C 语 
言 示例 翻译 为 其 他 常见 的 HOL6 层 语 言 。 

这 一 章 的 重点 在 于 C 内 存 模型 ， 包括 全 局 和 局 部 变量 、 带 参数 的 函数 ， 以 及 动态 分 配 
的 变量 。 此 外 ， 还 讲解 了 递归 ， 因 为 它 要 依赖 运行 时 堆栈 的 内 存 分 配 机 制 。 函 数 调 用 中 的 内 
存 分 配 过 程 阐释 得 相当 详细 ， 而 且 后 续 章 节 还 会 在 较 低 抽象 层 上 回顾 这 个 机 制 。 

ISA3 层 。ISA3 是 指令 集 架 构 层 。 这 一 层 用 两 章 来 描述 Pep/9 一 一 一 种 用 于 说 明 计算 机 
概念 的 虚拟 机 。Pep/9 是 一 个 小 型 的 复杂 指令 集 计 算 机 (CISC)， 也 是 冯 : 诺 依 曼 计 算 机 。 它 
的 中 央 处 理 器 (CPU) 包含 一 个 加 法 器 、 一 个 变 址 寄存 器 、 一 个 程序 计数 器 、 一 个 栈 指针 


图 P-1 典型 计算 机 系统 的 层次 结构 
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寄存 器 和 一 个 指令 寄存 器 。 它 有 八 种 寻 址 方式 : 立即 数 寻 址 、 直 接 寻 址 、 间 接 寻 址 、 栈 相 
对 寻 址 、 栈 相对 间接 寻 址 、 变 址 寻 址 、 栈 变 址 寻 址 和 栈 间 接 变 址 寻 址 。 在 模拟 只 读 存储 器 
(ROM) 中 ，Pep/9 的 操作 系统 可 以 从 学 生 的 文本 文件 中 加 载 并 执行 十 六 进 制 格式 的 程序 。 学 
生 可 以 在 Pep/9 模拟 器 上 运行 小 程序 ， 学 习 执 行 不 会 改变 内 存 值 的 ROM 存储 指令 。 

学 生 将 学 习 信息 表示 和 位 级 计算 机 组 成 的 基本 原理 。 由 于 本 书 的 中 心 主题 是 计算 机 各 层 
间 的 相互 关系 ， 因 此 ，Pep/9 相关 章节 展示 了 ASCII 表示 (ISA3 层 ) 和 C 的 char 类 型 变量 
(HOL6 层 ) 之 间 的 关系 。 此 外 ， 这 些 章节 还 展示 了 补 码 表示 (ISA3 层 ) 和 C 的 int 类 型 变量 
(HOL6 JZ) 之 间 的 关系 。 

Asmb5 层 。Asmb5 是 汇编 层 ， 它 把 汇编 器 的 概念 表示 为 两 个 层次 一 一 汇编 层 和 机 器 
层 一 一 之 间 的 翻译 器 。 它 引信 了 Asmb5 符号 和 符号 表 。 

这 里 是 统一 方法 派 上 用 场 的 地 方 。 第 5 章 和 第 6 章 将 编译 器 表示 为 从 高 级 语言 到 汇编 语 
言 的 翻译 器 。 前 面 学 生 已 经 学 习 了 一 种 特定 的 HOL6 层 语言 C 和 一 种 特定 的 冯 ' 诺 依 曼 型 
机 器 Pep/9。 这 两 章 通过 展示 层次 之 间 的 对 应 关系 来 继续 揭示 它们 之 间 的 关系 ， 其 中 包括 : 
HOL6 层 的 赋值 语句 与 Asmb5 层 的 装 入 /存储 指令 ; HOL6 层 的 循环 和 让 语 名 与 Asmb5 层 
的 分 支 指令 ; HOL6 层 的 数组 与 Asmb5 层 的 变 址 寻 址 ; HOL6 层 的 过 程 调用 与 Asmb5 层 的 
运行 时 栈 ; HOL6 层 的 函数 和 过 程 参数 与 Asmbs 层 的 栈 相 对 寻 址 ; HOL6 层 的 switch 语句 
与 Asmb5 层 的 跳 转 表 ; HOL6 层 的 指针 与 Asmbs 层 的 地 址 。 

统一 方法 之 美 就 在 于 可 以 在 较 低 层次 上 实现 C 章节 中 的 例子 。 比 如 ,第 2 章 递归 示例 
说 明 的 运行 时 栈 就 直接 对 应 于 Pep/9 主 存 的 硬件 栈 。 学 生 可 以 通过 两 个 层次 之 间 的 手动 翻译 
来 理解 编译 过 程 。 

这 种 方法 为 讨论 计算 机 科学 中 的 核心 问题 提供 了 一 种 很 自然 的 环境 。 例 如 ， 本 书 介绍 了 
HOL6 层 的 结构 化 编程 ， 可 以 和 Asmb 层 的 非 结构 化 编程 的 可 能 性 进行 对 比 。 书 中 讨论 了 
goto 争议 、 结 构 化 编程 /效率 之 间 的 折 中 ， 给 出 了 两 个 层次 上 语言 的 实际 例子 。 

第 7 章 向 学 生 介绍 了 计算 机 科学 理论 。 现 在 学 生 已 经 对 如 何 将 高 级 语言 翻译 为 汇编 语言 
有 了 直观 的 了 解 ， 那 么 ， 我 们 就 要 提出 所 有 计算 中 最 基本 的 问题 : 什么 可 以 被 自动 化 ?理论 
在 这 里 自然 又 合适 ， 因 为 学 生 现在 已 经 知道 了 什么 是 编译 器 (自动 化 翻译 器 ) 必须 做 的 。 他 
们 通过 识别 C 和 Pep/9 汇编 语言 的 语言 符号 来 学 习 语 法 分 析 和 有 限 状态 机 一 一 确定 性 的 和 非 
确定 性 的 。 这 一 章 包 含 了 两 种 小 语言 之 间 的 自动 翻译 器 ， 说 明了 词法 分 析 、 语 法 分 析 和 代码 
生成 。 词 法 分 析 器 是 有 限 状 态 机 的 实现 。 还 有 比 这 更 自然 的 介绍 理论 的 方法 吗 ? 

OS4 层 。OS4 层 用 两 章 来 讲述 操作 系统 。 第 8 章 是 关于 进程 管理 的 ， 其 中 有 两 节 讲 解 
了 Pep/9 操作 系统 的 概念 ， 一 节 是 装载 器 ， 另 一 节 是 陷阱 处 理 程序 。 七 条 指令 具有 产生 软件 
陷阱 的 未 实现 的 操作 码 。 操 作 系 统 将 用 户 正在 运行 进程 的 进程 控制 块 保存 到 系统 栈 ， 中 断 服 
务 例 程 解释 该 指令 。 通 过 具体 实现 一 个 挂 起 进程 来 强化 操作 系统 中 运行 和 等 待 进程 的 经 典 状 
态 转换 图 。 第 8 章 还 描述 了 并 发 进程 和 死 锁 。 第 9 章 曾 述 了 关于 主 存 和 磁盘 存储 器 的 存储 
管理 。 

LG1 B. LGI 层 用 两 章 来 讲述 组 合 电 路 与 时 序 电路 。 从 布尔 代数 的 定理 开始 ， 第 10 章 
强调 了 计算 机 科学 的 数学 基础 的 重要 性 。 它 展示 了 布尔 代数 和 逻辑 门 之 间 的 关系 ， 然 后 描述 
了 一 些 常 用 的 逻辑 设备 ,包括 一 个 完整 的 Pep/9 算术 逻辑 单元 (ALU) 的 逻辑 设计 。 第 11 章 
用 时 序 电 路 的 状态 转换 图 讲解 了 有 限 状 态 机 的 基本 概念 ， 还 描述 了 常见 的 计算 机 子 系统 ， 包 
括 双 向 总 线 、 内 存 芯片 以 及 双 端 口 存储 器 组 。 
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Mc2 fe. 3% 12 章 描述 了 Pep/9 CPU 的 微 程序 设计 控制 部 分 ， 给 出 了 一 些 示例 指令 和 
寻 址 方式 的 控制 序列 ， 还 提供 了 有 关 其 他 指令 和 寻 址 方式 的 大 量 练习 。 这 一 章 还 介绍 了 装 
和 /存储 架构 的 概念 ， 对比 了 MIPS 精简 指令 集 计算 机 (RISC) 和 Pep/9 复杂 指令 集 计 算 机 
(CISC)。 此 外 ,还 通过 对 高 速 缓存 、 流 水 线 、 动 态 分 支 预测 以 及 超标 量 机 器 的 描述 ,介绍 了 
一 些 性 能 问题 。 


教学 建议 

本 书 涵盖 内 容 相 当 广泛 ， 教 师 在 设计 课程 时 可 以 省 略 一 些 内 容 。 我 把 第 1 ~ 7 章 用 于 计 
算 机 系统 课程 ， 第 10 ~ 12 章 用 于 计算 机 组 成 课程 。 

本 书 中 , 第 1 一 5$ 章 必须 顺序 讲解 ， 第 6 章 和 第 7 章 可 以 按 任意 顺序 讲授 。 我 通常 会 
省 略 第 6 章 而 直接 讲 第 7 章 ， 开 始 一 个 大 型 软件 项 目 一 一 为 Pep/9 汇编 语言 的 子 集 写 汇编 
器 ， 这 样 学 生 在 一 学 期 中 有 足够 的 时 间 完 成 它 。 第 11 章 明 显 依赖 于 第 10 章 , 但 这 两 章 都 与 


第 9 章 无 关 ， 因 此 ， 第 9 章 可 以 省 略 。 图 P-2 是 章节 关系 依赖 示意 图 ， 总 结 了 可 以 省 略 哪些 
章节 。 





图 P-2 章节 关系 依赖 图 


第 5 版 的 变化 


第 5 版 中 的 每 一 章 都 有 改进 ， 主 要 集中 在 两 个 方面 : 一 个 是 虚拟 机 从 Pep/8 变 为 Pep/9 ; 
另 一 个 是 内 容 上 的 变化 。 第 二 点 涉及 面 太 大 ， 无 法 一 一 列 出 ， 这 里 只 给 出 其 中 的 主要 变化 。 
e HOL6 语言 一 一 第 5 版 中 的 HOL6 语言 从 C++ 变 为 C。C 作为 系统 编程 语言 更 为 常 
见 ， 而 且 也 更 加 适合 计算 机 系统 文本 。 上 一 版 指出 C++ 的 内 存 模型 包括 在 内 存 固定 
位 置 分 配 的 全 局 变量 、 在 运行 时 栈 上 分 配 的 局 部 变量 与 参数 以 及 从 堆 分 配 的 动态 变 
量 。 但 C++ 是 一 种 面向 对 象 (00) 的 语言 ， 它 的 内 存 模型 要 复杂 得 多 。 相 比 CH, 
上 述 模型 用 C 语言 表述 要 更 加 精确 一 些 。 变 化 体现 在 三 个 地 方 : 示例 程序 的 输入 / 
输出 (1/O) 用 scanf() 和 printf() 替代 了 cin Al cout ; 在 C 的 传递 引用 机 制 里 ， 实 际 
参数 显 式 地 使 用 地 址 运算 符 &， 形 式 参 数 则 使 用 对 应 的 指针 类 型 ; 堆 的 内 存 分 配 用 
malloc 替代 了 new. 
© 补充 示例 一 一 第 5 版 把 之 前 每 一 章 的 简要 人 物 传记 改 为 不 同 的 补充 示例 ， 放 在 特殊 格 
式 的 文本 框 中 。 每 一 个 补充 示例 都 是 该 章 所 描述 概念 的 真实 示例 。 大 多 数 章节 都 是 
描述 Pep/9 虚拟 机 的 ， 这 些 章节 的 补充 示例 给 出 了 Intel x86 架构 中 相应 部 分 的 实现 。 
新 补充 示例 提供 了 与 该 架构 一 致 的 运行 实例 ， 学 生 能 更 好 地 理解 虚拟 机 概念 与 真实 
实现 之 间 是 如 何 对 应 的 。 
新 主题 与 扩展 主题 一 一 第 1 章 现在 强调 的 是 如 何 利用 性 能 公式 和 带宽 概念 在 空间 和 
时 间 上 量化 二 进 制 信息 。QR 代码 和 颜色 显示 是 这 些 概念 的 详细 示例 。 第 3 章 描 述 
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了 Unicode, UTF-32 和 UTF-8 编码 。 第 4 章 讨 论 了 大 端 顺序 和 小 端 顺序 。 第 7 章 用 
Java 而 不 是 C++ 语言 实现 示例 翻译 器 。 第 12 章 的 微 代 码 示例 使 用 了 Pep/9 CPU 模拟 
器 新 的 UnitPre 和 UnitPost 特性 。 双 字 节 数据 总 线 现在 得 到 了 模拟 器 的 支持 ， 这 使 得 
讨论 主题 可 以 扩展 到 内 存 对 齐 问题 和 新 的 ALIGN 伪 指 令 。 


Pep/9 取代 了 前 两 版 所 用 的 虚拟 机 Pep/8。 由 于 这 两 种 机 器 指令 集 的 不 同 ，Pep/8 的 源 程 
序 和 目标 程序 不 能 与 Pep/9 的 兼容 。 不 过 只 有 几 条 指令 会 受到 影响 ， 多 数 还 是 和 原来 一 样 ， 
包括 八 种 寻 址 方式 。Pep/9 有 下 述 变化 : 


RET 代替 了 RETn 一 一 Pep/8 有 八 种 返回 语句 ， 分 别 为 RET0，RET1，…，RET7.。 
RETn 从 运行 时 栈 释 放 n 个 字 节 ， 然 后 执行 从 函数 调用 的 返回 。 这 样 做 的 理由 是 ， 返 
回 之 前 总 要 释放 局 部 变量 ， 所 以 ， 如 果 汇 编 语言 程序 员 不 需要 在 返回 前 用 ADDSP 指 
令 显 式 释 放 局 部 变量 的 话 ， 程 序 就 会 更 短 一 些 

虽然 这 种 ISA 设计 在 体系 结构 原理 上 可 能 是 合理 的 ， 但 在 教学 上 却 存在 缺陷 。 
问题 是 学 生 必 须 学 习 两 种 不 同 的 概念 : 数据 的 释放 机 制 和 控制 流 的 返回 机 制 。 将 这 两 
种 不 同 的 概念 组 合 在 一 条 语句 中 ， 在 学 习 时 可 能 会 造成 混淆 。 现 在 ，Pep/9 要 求学 生 
用 ADDSP 语句 显 式 地 释放 局 部 变量 。 另 一 个 格式 上 的 优势 是 ， 函 数 结束 时 显 式 使 用 
ADDSP 释放 局 部 变量 直接 与 函数 开始 时 用 SUBSP 分 配 局 部 变量 相对 应 。 

TTT i 

入 /输出 的 CHARI 和 CHARO。 大 多 数 真实 计算 机 系统 都 把 输入 /输出 映射 到 内 存 ， 
Pep/9 现在 就 是 这 样 设计 的 。 在 新 指令 集中 没有 原生 的 输入 /输出 指令 。 相 反 ，Pep/8 
的 指令 





CHARI alpha,ad 
被 如 下 Pep/9 指令 所 替代 ， 其 中 的 charin 是 输入 设备 。 


LDBA charIn,d ;Load byte to A from chariIn 
STBA alpha,ad ;Store byte from A to alpha 


而 Pep/8 指令 


CHARO beta,ad 


也 被 如 下 Pep/9 指令 所 蔡 代 ， 其 中 的 charOut 是 输出 设备 。 


LDBA beta,ad ;Load byte to A from beta 
STBA charOut,d ;Store byte to charOut 

在 上 述 指令 中 ，ad 表示 该 指令 的 任意 一 种 合法 的 寻 址 方式 。 符 号 charIn 和 
charOut 在 Pep/9 操作 系统 中 定义 ， 并 作为 机 器 向 量 保存 在 内 存 底 部 。 它 们 的 值 会 自 
动 包含 进 汇编 器 的 符号 表 中 。 

内 存 映 射 IO 的 一 个 缺点 是 ，Pep/8 程序 中 的 每 一 个 CHARI 和 CHARO 语句 现 
在 都 需要 编写 为 两 条 语句 ， 这 使 得 程序 变 长 。 不 过 ， 陷 阱 指令 DECI, DECO, STRO 
与 原来 一 样 ， 这 使 得 问题 得 以 控制 ， 因 为 原生 LO 指令 隐藏 在 它们 的 陷阱 例 程 中 。 

学 生 通 过 从 输入 设备 地 址 装 入 以 及 向 输出 设备 地 址 存储 直接 学 习 内 存 映 射 /0O 是 
如 何 工作 的 ,这 是 非常 有 利 的 。 这 个 要 求 还 说 明了 内 存 映射 的 概念 和 用 法 ， 在 Pep/8 


中 ,这 是 学 生 想 要 避 开 的 问题 。 此 外 ， 这 与 第 11 章 的 地 址 解码 示例 也 有 很 好 的 关联 ， 
它 展 示 了 怎样 把 一 个 八 端口 IO 芯片 连接 到 内 存 映 射 。 
新 的 原生 指令 CPBr 一 一 在 Pep/8 中 ， 字 节 量 必须 用 CPr 比较 ， 该 指令 比较 两 字 节 的 
对 象 。 因 此 ， 比 较 也 包括 了 高 字 节 ， 有 时 在 比较 之 前 要 清除 寄存 器 的 高 字 节 。 这 使 
得 进行 字 节 比较 的 汇编 代码 有 些 复杂 。 

CPBr 是 新 的 字 节 比较 指令 ， 通 过 设置 状态 位 而 不 再 考虑 寄存 器 的 高 字 节 。 其 结 
果 代 码 更 易于 理解 和 编写 。 
改进 的 助 记 符 一 一 Pep/9 重新 命名 了 比较 指令 、 装 入 指令 和 存储 指令 的 助 记 符 ， 如 图 
P-3 所 示 。 新 方案 保留 了 比较 中 的 CP、 装 人 中 的 LD 和 存储 中 的 ST， 同时 又 在 这 组 
指令 中 一 致使 用 字母 W 表示 字 (这 是 现在 需要 的 )， 字母 B 表示 字 节 。 这 个 命名 规则 
一 致 性 更 强 ， 并 且 针 对 学 生 有 遗忘 “ 字 ” (Pep 计算 机 中 的 双 字 节 ) 含义 的 倾向 ， 把 字 
EE W 加 到 双 字 APERET ' 字 ”的 强调 。 


比较 字 CPWr cPr 
比较 字 节 CPBr 不 可 用 
装 人 字 LDWr LDr 

装 人 字 节 LDBr LDBYTEr 
存储 字 STWr str 
存储 字 节 STBr STBYTEr 


图 P-3 新 的 Pep/9 指令 助 记 符 


新 的 陷阱 指令 HEXO 一 一 在 Pep/9 指令 集中 , 与 RETn 和 字符 IO 指令 一 起 删除 的 还 
有 陷阱 指令 NOP2 和 NOP3， 取而代之 的 是 一 条 非 一 元 陷阱 指令 HEXO。HEXO 代表 
的 是 十 六 进 制 输出 ， 存 在 于 Pep/7 中 ， 现 在 在 Pep/9 中 再 次 出 现 。 它 输出 的 一 个 字 包 
含 四 个 十 六 进 制 字符 。 

寻 址 方式 的 名 称 一 一 Pep/9 将 栈 变 址 间接 寻 址 改 为 栈 间 接 变 址 寻 址 ， 相 应 的 汇编 器 符 
号 也 从 sxf 改 为 sfx。 这 个 变化 更 准确 地 反映 了 寻 址 方式 的 语义 ， 因 为 栈 间 接 操作 发 
生 在 变 址 操作 之 前 。 

扩展 的 MIPS 内 容 一 一 MIPS 架构 仍然 是 与 Pep/9 CISC 模型 形成 对 比 的 RISC 模型 。 
其 内 容 得 到 了 扩展 ， 对 所 有 的 MIPS 寻 址 方式 、 指 令 类 型 以 及 它们 在 LG1 层 上 的 
实现 进行 了 更 加 广泛 和 系统 的 描述 。 在 说 明 MIPS 架构 的 同时 ， 第 5 版 也 包括 了 对 
RISC 设计 原则 更 加 宽泛 的 阐述 。 


本 书 特性 


本 书 有 几 个 独特 的 方面 ， 使 之 有 别 于 其 他 计算 机 系统 、 汇 编 语言 和 计算 机 组 成 方面 的 
书籍 。 

e 以 概念 为 核心 一 一 许多 教科 书 试图 跟 上 领域 的 变化 ， 包 括 最 新 的 技术 发 展 。 比 如 ， 最 

新 外 围 设备 的 通信 协议 规范 。 通 常 ， 这 类 书 通 篇 都 在 描述 性 地 解释 “设备 是 如 何 工 

作 的 ”。 本 书 避 开 了 这 类 资料 ， 而 只 选择 基础 的 计算 概念 ， 掌 握 了 这 些 就 有 了 理解 当 

前 和 未 来 技术 的 基础 。 例 如 ,在 掌握 空间 / 时 间 折 中 概念 的 时 候 ， 让 学 生 实践 数字 电 


路 设计 问题 的 方案 比 单 纯 阅 读 笼 统 的 描述 要 重要 得 多 。 再 举 一 个 例子 ， 通 过 学 习 如 
何在 ISA 指令 的 微 代码 实现 中 合并 周期 来 掌握 硬件 并 行 的 概念 ， 才 是 最 好 的 。 
© 强调 解决 问题 一 一 在 讨论 某 个 主题 时 ， 如 果 只 是 采用 听讲 或 阅读 的 方式 ， 那 么 学 生 能 
记 住 的 内 容 就 很 少 ; 如果 采用 的 是 实践 的 方式 ， 他 们 能 记 住 的 就 会 更 多 。 本 书 强 调 
解决 问题 ， 全 书 章节 后 面 有 将 近 400 道 练习 ， 其 中 很 多 练习 有 多 个 部 分 。 这 些 练习 
不 会 让 学 生 重复 课本 中 的 原 话 ， 而 是 要 求 量化 地 解答 、 分 析 或 者 设计 系统 某 个 抽象 
层次 上 的 程序 或 数字 电路 。 
一 致 的 机 器 模型 一 一 Pep/9 机 器 是 一 个 小 型 的 CISC 计算 机 ， 是 描述 系统 所 有 层次 
的 载体 。 学 生 可 以 清晰 地 看 到 抽象 层次 之 间 的 关系 ， 因 为 他 们 要 在 所 有 的 层次 上 
为 这 个 机 器 编程 或 者 设计 数字 电路 。 例 如 ， 当 在 LG1 层 设 计 ALU 组 件 时 ， 他 们 知 
道 ALU 在 ISA3 层 的 实现 中 应 该 在 哪个 位 置 。 通 过 像 编译 器 那样 把 C 程序 翻译 成 汇 
编 语言 ， 他 们 将 学 到 优化 编译 器 和 非 优 化 编译 器 之 间 的 差别 。 在 不 同 层次 上 都 使 用 
同样 的 机 器 模型 对 学 习 活 动 来 说 在 效率 上 有 很 大 的 优势 ， 因 为 模型 从 上 至 下 都 是 一 
致 的 。 不 过 本 书 也 讲述 了 MIPS 机 器 ， 对 比 了 RISC 设计 原理 和 微 程序 设计 的 CISC 
设计 。 
完整 的 程序 示例 一 一 许多 计算 机 组 成 和 汇编 语言 的 书 会 受到 代码 片段 综合 征 的 影响 。 
Pep/9 的 内 存 模型 、 寻 址 方式 和 输入 /输出 特性 使 得 学 生 能 写 出 完整 的 程序 ， 而 不 只 
是 代码 片段 ， 这 些 程序 执行 和 测试 起 来 也 很 容易 。 真 实 的 机 器 ， 特 别 是 RISC 机 器 ， 
有 复杂 的 函数 调用 协议 ， 涉 及 寄存 器 分 配 、 寄 存 器 溢出 和 内 存 对 齐 限 制 之 类 的 问题 。 
Pep/9 是 少数 几 种 教学 机 之 一 (有 可 能 是 唯一 一 个 )， 人 允许 学 生 书 写 具 有 输入 /输出 的 
完整 程序 ， 可 以 使 用 全 局 变量 和 局 部 变量 、 全 局 数组 和 局 部 数组 、 传 值 调 用 和 传 引 
用 调用 、 数 组 参数 、 具 有 转移 表 的 switch 语句 、 递 归 、 具 有 指针 的 链 式 结构 和 堆 。 
写 完 整 程序 的 作业 进一步 实现 了 通过 动手 来 学 习 的 目标 ， 而 不 是 通过 读 代 码 片段 来 
= 
理论 与 实践 相 结 合 一 一 有 些 读者 注意 到 了 ， 讲述 语言 翻译 原理 的 第 7 章 在 计算 机 系统 
书 中 不 常见 。 这 种 现象 可 翡 地 说 明了 计算 机 科学 课程 体系 甚至 计算 机 科学 领域 自身 
存在 的 理论 和 实践 之 间 的 鸿沟 。 既 然 本 书 讲述 了 HOL6 层 的 C 语言 、Asmbs 层 的 汇 
编 语言 和 ISA3 层 的 机 器 语言 ， 而 且 都 有 一 个 目标 ， 即 理解 层次 之 间 的 关系 ,那么 一 
个 更 好 的 问题 是 :“ 为 什么 不 能 包括 讲述 语言 翻译 原理 的 一 章 呢 ?” 本 书 尽 可 能 地 加 入 
理论 以 支持 实践 。 例 如 ， 介 绍 布尔 代数 并 将 其 作为 一 个 公理 系统 ， 配 合 练习 来 证 明 
定理 。 
© 广度 和 深度 一 -第 1 一 6 章 中 的 内 容 对 计算 机 系统 或 汇编 语言 编程 的 书 来 说 是 很 典型 
的 ,第 8 一 12 章 对 计算 机 组 成 的 书 来 说 是 很 典型 的 。 在 一 本 书 中 包括 这 么 广泛 的 内 
容 是 很 独特 的 ， 而 且 还 在 一 个 完整 机 器 的 各 个 抽象 层次 上 使 用 一 致 的 机 器 模型 。 数 
FER LG 层 内 容 的 深度 也 是 很 特别 的 ， 它 使 得 CPU 的 组 成 部 分 不 再 神秘 。 例 如 ， 
本 书 描述 了 Pep/9 CPU 的 复 用 器 、 加 法 器 、ALU、 寄 存 器 、 内 存 子 系统 和 双向 总 线 
的 实现 。 学 生 学 习 逻 辑 门 层 的 实现 后 ， 没 有 概念 上 的 空洞 ， 而 如 果 只 是 泛泛 地 描述 ， 
学 生 就 只 能 选择 相信 而 不 能 完全 理解 。 
本 书 回答 了 这 个 问题 “汇编 语言 编程 和 计算 机 组 成 在 计算 机 科学 课程 体系 中 的 位 置 是 
什么 ?” 它 提供 了 对 无 处 不 在 的 汉 ， 诺 依 曼 机 器 架构 的 深入 理解 。 本 书 保 持 了 独特 的 目标 ， 








即 提供 本 领域 内 所 有 主要 知识 域 的 综合 概述 ， 包 括 软 件 和 硬件 的 结合 、 理 论 和 实践 的 结合 。 
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本 书 第 1 版 出 版 于 1999 年 ， 从 那 时 开始 本 书 的 目标 就 是 通过 一 个 虚拟 机 器 (初版 中 是 
Pep/6 ) 来 讲解 典型 计算 机 系统 全 部 七 个 抽象 层 之 间 的 关系 ， 从 而 统一 呈现 计算 机 系统 。 当 
时 (甚至 现在 也 是 ) 本 书 的 内 容 跨 越 了 多 个 标准 课程 ， 增 加 了 知识 面 的 宽度 ， 这 样 的 做 法 同 
时 牺牲 了 标准 汇编 语言 、 操 作 系 统 、 计 算 机 体系 结构 、 计 算 机 组 成 和 数字 电路 设计 课程 中 传 
统 内 容 的 深度 。 

最 新 的 ACM/IEEE 课程 指南 一 一 计算 机 科学 课程 体系 20139 (CS2013 ) 特别 指出 领域 快 
速 扩 张 带 来 的 课程 挑战 : 

与 计算 机 科学 教育 领域 相关 的 主题 越 来 越 多 样 化 ， 以 及 计算 与 其 他 学 科 的 日 益 融 合 给 这 
一 努力 带 来 了 特殊 的 挑战 。 在 教学 内 容 增 加 和 保持 建议 在 本 科教 育 背景 下 具备 可 行 性 和 可 操 
作 性 之 间 平 衡 是 相当 困难 的 。 

对 这 一 挑战 的 应 对 之 一 就 是 指导 方针 的 不 断 演 进 ， 而 这 恰好 就 是 本 书 从 第 1 版 起 就 坚持 
贯彻 的 方向 。CS2013 重组 了 之 前 的 “知识 体 ”， 删 除了 一 些 旧 领域 ,增加 了 一 些 新 领域 。 指 
南 中 的 一 个 新 知识 领域 (Knowledge Area，KA) 就 是 系统 基础 : 

在 以 前 的 课程 内 容 中 ， 典 型 计算 系统 的 交互 层 从 硬件 构建 块 到 架构 组 织 ， 到 操作 
系统 服务 ， 再 到 应 用 程序 执行 环境 一 一 都 表示 为 独立 的 KKA。 而 新 的 系统 基础 KA 则 为 其 他 
KA 展示 了 统一 的 系统 视角 和 共同 的 概念 基础 …… 

CS2013 中 新 系统 基础 KA 的 目标 与 本 书 的 目标 是 一 致 的 ， 即 为 计算 机 科学 的 其 他 主题 
提出 一 个 “统一 的 系统 视角 ”和 共同 的 概念 基础 。 本 书 是 一 本 成 熟 的 教材 ， 它 难得 地 满足 了 
最 新 计算 机 科学 课程 体系 指南 的 这 一 重要 新 目标 。 

教 辅 资 源 

从 出 版 商 网 站 (go.jblearning.com/warfordSe) 可 以 获取 下 列 资源 。 

Pep/9 汇编 器 和 模拟 器 。Pep/9 机 器 在 MS Windows, Mac OS X 和 UNIX/Linux 系统 上 
都 可 和 运行。 汇编 器 的 特性 包括 : 

。 集成 的 文本 编辑 器 。 

。 在 源 代码 中 发 现 错误 的 地 方 插入 错误 消息 。 

e 对 学 生 友好 的 、 十 六 进 制 的 机 器 语言 目标 代码 。 

o 能 跳 过 汇编 器 ， 直 接 用 机 器 语言 编写 代码 。 

o 能 够 重 定义 触发 同步 陷阱 的 未 实现 操作 码 的 助 记 符 。 

模拟 器 的 特性 包括 : 

e 模拟 的 ROM， 存 储 指令 不 能 修改 ROM 中 的 内 容 。 

e 在 模拟 的 ROM 中 烧 入 了 一 个 小 的 操作 系统 ， 包 括 一 个 装载 器 和 一 个 陷阱 处 理 程序 。 
一 个 集成 的 调试 器 ， 人 允许 设置 断 点 、 单 步 执行 、CPU 跟踪 和 内 存 跟 踪 。 





© Computer Science Curricula 2013, Curriculum Guidelines for Undergraduate Degree Programs in Computer 
Science, The Joint Task Force on Computing Curricula, Association for Computing Machinery (ACM) IEEE 
Computer Society, December 20, 2013. 


XII 


o 能 以 任何 组 合 跟踪 应 用 程序 Fe a RE ASEM 

e 具备 从 无 限 循环 中 恢复 的 能 力 。 

。 能 够 通过 为 未 实现 操作 码 设 计 新 的 陷阱 处 理 程序 来 修改 操作 系统 。 

e 从 应 用 程序 中 构建 的 每 个 示例 都 成 为 课堂 演示 的 有 用 工具 。 

Pep/9 CPU 模拟 器 。 包 括 MS Windows, Mac OS X 和 UNIX/Linux 系统 版 本 ， 可 以 用 
在 计算 机 组 成 课程 中 。CPU 模拟 器 的 特性 包括 : 

o 颜色 编码 的 展示 通路 ， 根 据 多 路 复 用 器 的 控制 信号 跟踪 数据 流 。 

o 操作 的 单 周 期 模式 ， 用 GUI 输入 每 个 控制 信号 ， 立 即 展示 信号 的 效果 。 

© 操作 的 多 周期 模式 ， 学 生 可 以 在 集成 的 文本 编辑 器 中 编写 Mc2 微 代 码 序列 并 执行 它 

们 以 便 实现 ISA3 指令 。 

o 第 5 版 的 新 特点 : 针对 应 用 程序 的 每 个 微 代码 问题 和 每 个 示例 的 单元 测试 。 

课程 课件 。 一 套 完整 的 课件 ， 每 章 约 有 50 ~ 125 页 PDF 格式 的 课程 幻灯 片 。 幻 灯 片 包 
括 课 本 中 所 有 的 图 和 总 结 信息 ， 通 常 以 标号 的 形式 给 出 。 不 过 其 中 没有 太 多 的 例子 ， 给 教师 

展示 示例 和 指导 讨论 留 出 了 空间 。 

考试 题目 。 提 供 一 组 考试 题目 ， 包 括 参考 信息 ， 例 如 ASCII 表 、 指 令 集 表 等 ， 供 考试 
和 自学 之 用 。 

数字 电路 实验 。6 个 数字 电路 实验 ， 能 够 让 学 生 在 物理 实验 电路 板 上 亲身 体验 。 这 些 实 
验 说 明了 第 10 章 和 第 11 章 的 组 合 和 时 序 设备 ， 使 用 了 许多 本 书 中 没 讲 到 的 电路 。 学 生 可 以 
自学 实际 的 数字 设计 和 实现 概念 ， 这 些 超出 了 本 书 的 讲述 范围 。 实 验 时 可 以 按照 书 中 讨论 的 
主题 顺序 ， 从 组 合 电 路 开始 ， 然 后 是 时 序 电 路 和 ALU. 

答案 手册 。 附 录 中 有 部 分 练习 的 答案 ， 全 部 练习 和 编程 题 的 答案 对 采用 本 书 作为 教材 的 
教师 开放 。 

若 想 了 解 指导 教师 如 何 获得 访问 上 述 资源 的 资格 ， 请 联系 Jones & Bartlett Learning 的 
代理 商 。 
致谢 

Pep/1 有 16 条 指令 、 一 个 累加 器 和 一 种 寻 址 方式 。Pep/2 增加 了 变 址 寻 址 。John Vannoy 
H ALGOL W 语言 写 了 两 个 模拟 器 。Pep/3 有 32 条 指令 ， 用 Pascal 语言 编写 ， 是 学 生 软 件 
项 目 ， 由 Steve Dimse, Russ Hughes, Kazuo Ishikawa, Nancy Brunet 和 Yvonne Smith 完成 。 
Harold Stone 在 早期 审阅 中 提出 许多 对 Pep/3 架构 的 改进 意见 ， 后 来 被 加 到 Pep/4 中 ， 并 延续 
到 后 续 的 机 器 中 。Pep/4 有 特殊 的 栈 指令 、 模 拟 ROM 和 软件 陷阱 。Pep/5 有 更 正 交 的 设计 ， 
允许 任何 指令 使 用 任何 寻 址 方式 。John Rooker 写 了 Pep/4 系统 和 早期 的 Pep/5 版 本 。Gerry St. 
Romain 实现 了 Mac OS 版 本 和 MS-DOS 版 本 。Pep/6 简化 了 变 址 寻 址 方式 ， 也 包括 了 一 组 完 
整 的 条 件 分 支 指令 。John Webb 用 BlackBox 开发 系统 编写 了 跟踪 功能 。Pep/7 把 安装 的 内 存 
从 4KiB 增加 到 了 32KiB。Pep/8 把 寻 址 方式 的 数量 从 4 增加 到 8， 安装 的 内 存 增加 到 64KiB。 
Pep/8 汇编 器 和 模拟 需 的 GUI 版 本 由 一 组 学 生 用 Qt 开发 系统 和 C++ 实现 和 维护 ， 小 组 成 
员 包 括 Deacon Bradley, Jeff Cook, Nathan Counts, Stuartt Fox, Dave Grue, Justin Haight, 
Paul Harvey. Hermi Heimgartner, Matt Highfield, Trent Kyono, Malcolm Lipscomb, Brady 
Lockhart, Adrian Lomas, Scott Mace, Ryan Okelberry, Thomas Rampelberg, Mike Spandrio、 
Jack Thomason, Daniel Walton, Di Wang, Peter Warford 和 Matt Wells, Ryan Okelberry 也 & 
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与 编写 了 Pep/8 CPU 模拟 器 。Luciano d'Ilori 编写 了 汇编 器 的 命令 行 版 本 。 最 新 版 本 的 Pep/8 
和 Pep/8 CPU 以 及 当前 版 本 的 Pep/9 和 Pep/9 CPU 由 Emily Dimpf 和 本 书 作 者 用 Qt 重新 

Tanenbaum 的 《Structured Computer Organization } © 比 其 他 任何 一 本 书 都 更 大 地 影响 了 
本 书 的 编写 。 本 书 扩展 了 Tanenbaum 书 中 的 层次 结构 ， 在 上 面 增加 了 高 级 语言 层 和 应 用 层 。 

许多 书稿 审阅 者 、 学 生 和 前 一 版 本 的 用 户 极 大 地 影响 了 本 版 本 的 终 稿 ， 他 们 是 : 
Kenneth Araujo, Ziya Arnavut, Wayne P. Bailey, Leo Benegas, Jim Bilitski、Noni 
Bohonak Dan Brennan, Michael Yonshiki Choi, Christopher Cischke, Collin Cowart, 
Lionel Craddock, William Decker, Fadi Deek, Peter Drexel, Gerald S. Eisman, Victoria 
Evans, Mark Fienup, Paula Ford, Brooke Fugate, Robert Gann, David Garnick, Ephraim P. 
Glinert, John Goulden, Dave Hanscom, Michael Hennessy, Paul Jackowitz, Mark Johnson, 
Michael Johnson, Amitava Karmaker, Michael Kirkpatrick, Peter MacPherson, Andrew 
Malton, Robert Martin, Johnon Maxfield, John McCormick, Richard H. Mercer, Jonathon 
Mohr, Randy Molmen, Hadi Moradi, John Motil, Mohammad Muztaba Fuad, Peter Ng, 
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Computer Systems, Fifth Edition 


计算 机 系统 





计算 机 科学 的 基本 问题 是 : 什么 能 够 被 自动 化 ?就 像 工业 革命 中 研制 出 的 机 器 使 得 手工 
劳作 自动 化 了 ,计算 机 实现 了 信息 处 理 的 自动 化 。20 世纪 40 年 代 研 发 出 电子 计算 机 时 ， 它 
们 的 设计 者 利用 这 些 机 器 来 自动 求解 数学 问题 。 不 过 从 那 时 起 ,计算 机 就 被 应 用 到 了 各 种 问 
题 上 ， 例 如 金融 会 计 、 电 影 制作 和 智能 手机 。 计 算 机 发 展 得 如 此 迅猛 ， 几 乎 每 天 都 有 新 的 计 
算 机 自动 化 领域 出 现 。 

本 书 的 目的 是 展示 计算 机 如 何 将 信息 处 理 自动 化 。 从 原则 上 来 说 ,计算 机 所 能 做 的 一 
切 ， 你 都 能 做 。 计 算 机 和 人 执行 任务 的 主要 区 别 在 于 计算 机 执行 任务 非常 迅速 。 不 过 要 利用 
它 的 速度 ， 人 们 必须 指导 计算 机 ， 也 就 是 对 计算 机 进行 编程 。 

要 想 理解 计算 机 的 本 质 ， 最 好 的 方法 是 学 习 如 何 对 机 器 编程 。 编 写 程序 要 求学 习 编程 语 
言 。 在 投入 学 习 编程 语言 的 细节 之 前 ， 本 章 首先 介绍 抽象 的 概念 (本 书 就 是 基于 抽象 这 一 主 
题 的 )， 然 后 描述 计算 机 系统 的 硬件 和 软件 组 成 ， 最 后 描述 一 个 典型 应 用 一 一 数据 库 系统 。 


1.1 抽象 层次 


抽象 层次 这 个 概念 在 艺术 以 及 自然 和 应 用 科学 中 都 广泛 存在 。 抽 和 象 的 完整 定义 是 多 面 
的 ， 对 我 们 要 讲述 的 领域 来 说 ， 包 括 下 面 这 些 部 分 : 

。 隐藏 细节 以 展示 物质 的 本 质 。 

© 概要 结构 。 

。 通过 一 连 串 的 命令 划分 责任 。 

© 将 一 个 系统 细 分 成 较 小 的 子 系统 。 

本 书 的 主题 就 是 把 抽象 应 用 到 计算 机 科学 中 。 不 过 ， 我 们 先 从 考虑 其 他 一 些 非 计算 机 科 
学 领域 中 的 抽象 层次 开始 。 从 这 些 领 域 中 得 出 的 类 比 会 扩展 到 上 述 抽象 定义 中 的 4 个 部 分 ， 
再 应 用 到 计算 机 系统 上 。 

抽象 层次 的 3 种 常见 图 形 化 表示 是 : 层次 图 ; REA; 层次 结构 或 树 状 图 (如 图 1-1 所 
示 )。 现 在 ,我 们 分 析 每 种 抽象 的 表示 ,说明 它们 是 如 何 类 比 的 。 这 三 张 图 也 适用 于 贯穿 本 
书 的 计算 机 系统 中 的 抽象 层次 。 


beers 


| 


a) 层次 图 b) REKI c) 层次 结构 或 树 状 图 
图 1-1 抽象 层次 的 三 种 图 形 化 表示 
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如 图 1-1a 所 示 ， 层 次 图 是 一 组 垂直 排列 的 方 框 。 最 顶端 的 方 框 表 示 最 高 层次 的 抽象 ， 
最 底 端 的 方 框 表示 最 低层 次 的 抽象 。 抽 象 的 层 数 取决 于 所 描述 的 系统 。 这 张 图 表示 一 个 三 层 
抽象 的 系统 

图 1-1b 是 次 套图 。 与 层次 图 一 样 ， 艇 套图 也 是 一 组 方 框 。 它 总 是 由 一 个 大 的 外 层 方 框 
和 一 些 嵌 套 在 其 中 的 其 他 方 框 组 成 。 在 这 张 图 中 ， 外 层 的 大 方 框 里 直接 嵌 套 了 两 个 方 框 。 这 
两 个 方 框 中 ， 下 面 那 个 里 面 还 肉 套 了 一 个 方 框 。 贬 套图 中 最 外 层 的 方 框 对 应 于 层次 图 中 最 项 
层 的 方 框 。 髓 套 的 方 框 对 应 于 层次 图 中 较 低层 次 的 方 框 

(REARS, 方 框 是 不 重合 的 。 也 就 是 说 ， 风 套 图 中 绝 不 会 有 边界 互相 交叉 的 方 框 。 

个 方 框 总 是 完全 包含 男 一 个 方 框 

抽象 层次 的 第 三 种 图 形 化 表示 是 层次 结构 或 树 状 图 ， 如 图 1-1c 所 示 。 在 树 状 图 中 ， 大 
MERET mn ee hh et er eee erie gh pire 

， 附 着 在 最 小 的 树枝 上 。 图 1-1c 这 样 的 树 状 图 ， 主 干 在 顶端 而 不 是 底部 。 每 个 方 框 称 为 
一 个 结 点 ， 唯 一 iaia eka 没有 更 低层 相连 的 结 点 是 叶子 。 图 1-1c 是 一 棵 有 着 一 
个 根 结 点 和 三 个 叶子 结 点 的 树 。 层 次 结构 图 中 顶端 的 结 点 对 应 于 层次 图 中 的 顶端 方 框 。 


1.1.1 艺术 中 的 抽象 


享 利 . 马 蒂 斯 ( Henri Matisse) 是 现代 艺术 史上 的 一 位 重要 人 物 。1909 年 ， 他 制作 了 
一 尊 女 人 后 背 的 铜 雕塑 ， 名 为 《The Back I》。4 年 后 ， 他 又 创作 了 一 每 同样 主题 页 的 作品 ， 
不 过 用 了 更 简单 的 表现 形式 ， 并 将 此 作品 命名 为 《 The Back 开 》。 又 过 了 4 年 ， 他 创作 了 
《 The Back Il), 13 年 后 又 创作 了 《 The Back IV). Al 1-2 展示 了 这 4 SE. 





The Back I , 1909 The Back I], 1913 The Back Il, 1917 The Back IV, 1930 


图 1-2 HARARE. HFE in FI Ae BLP RO ah SH He 
Matisse, Henri (1869-1954). Nude from Behind. Bas-relief in bronze. © 2015 Succession H. Matisse/Artists Rights 
Society (ARS), New York; Photo credit: © CNAC/MNAM/Dist. RMN-Grand Palais/Art Resource, NY. 


这 些 作品 的 一 个 显著 特征 是 ， 在 一 件 作 品 到 男 一 件 作 品 的 发 展 中 ， 艺 术 家 不 断 地 去 除 细 
入 。 第 二 苯 有 雕塑 中 背部 轮廓 变 得 不 怎么 清晰 ， 第 三 尊 雕 塑 中 右手 手指 被 隐 去 ， 而 在 最 为 抽象 
的 第 四 尊 雕 塑 中 ， 几 乎 不 能 识别 出 壁 部 。 
马 蒂 斯 追求 表达 性 ， 他 故意 隐藏 视觉 上 的 细节 而 去 展示 主题 的 实质 。1908 年 他 写 道 : 
在 一 幅 画 中 ， 每 个 可 见 的 部 分 都 扮演 着 赋予 它 的 角色 ， 无 论 是 主要 的 还 是 次 要 的 。 画 中 
所 有 那些 没 用 的 部 分 都 是 有 害 的 。 艺 术 作 品 必 须 在 整体 上 是 和 谐 的 ， 因 为 在 观赏 者 脑海 中 ， 
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多 余 的 细节 会 侵占 主要 元 素 的 位 置 。8 

隐藏 细节 是 抽象 层次 这 一 概念 的 必要 组 成 部 分 ， 它 直接 适用 于 计算 机 科学 。 在 计算 机 科 
学 术语 中 ,《 The Back IJV 》 抽 象 层 次 最 高 ,《 The Back 1 》 层 次 最 低 。 图 1-3 的 层次 图 展示 
了 这 些 层次 的 关系 。 

就 像 艺术 家 一 样 ， 计 算 机 科学 家 必须 认识 到 
要 素 和 细节 之 间 的 区 别 。 按 时 间 进程 ， 马 蒂 斯 的 
《 The Back 》 系 列 是 从 最 注重 细节 演变 到 最 抽象 。 
然而 ， 在 计算 机 科学 中 ， 解 决 问题 的 进程 应 该 是 从 
最 抽象 到 最 详细 。 本 书 的 目标 之 一 就 是 教 你 如 何 进 
行 抽 象 思维 ， 如 何在 对 一 个 问题 制定 解决 方案 时 忽 
略 无 关 的 细节 。 并 不 是 说 在 计算 机 科学 中 细节 不 重 
要 ! 细节 是 最 重要 的 。 不 过 在 计算 问题 中 ， 人 们 自 B13 马 蒂 斯 雕塑 中 的 抽象 层次 , 《The 
然 倾 向 于 在 开始 阶段 非常 注重 很 多 细节 ; 而 在 计算 Back IV 》 位 于 抽象 的 最 高 层 
机 科学 中 解决 问题 时 ， 要 素 应 该 比 细 节 优先 考虑 。 


1.1.2 文档 中 的 抽象 


在 概括 书面 文档 的 架构 时 ， 抽 象 层次 的 作用 也 是 显而易见 的 。 以 美国 宪法 为 例 ， 它 包括 7 
章 ， 每 章 又 分 为 多 节 。 下 面 的 大 纲 展示 了 条 款 和 章节 的 标题 ， 它 并 不 是 宪法 本 身 的 一 部 分 9 ， 
只 不 过 是 总 结 了 各 个 部 分 的 内 容 。 


The Back IV 
The Back II 







第 一 条 ”立法 部 门 
第 一 款 ”国会 
第 二 款 ”众议院 
参议 院 
参议 员 和 众 议 员 的 选举 一 一 国会 会 议 
国会 两 院 的 权利 与 职责 
参议 员 和 众 议 员 的 报酬 、 特 权 及 任职 限制 
法 案 通 过 的 方式 
国会 权利 
对 联邦 权利 的 限制 
对 各 州 的 限制 
第 二 条 ”行政 部 门 
总 统 
总 统 的 权利 
总 统 的 职责 
行政 和 文职 官员 的 免职 





© Alfred H. Barr, Jr., Matisse: His Art and His Public (New York: The Museum of Modern Art, 1951). 
© California State Senate, J. A. Beak, Secretary of the Senate, Constitution of the State of California, the Constitution of 
the United States, and Related Documents (Sacramento, 1967). 
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司法 部 门 
联邦 法 院 的 司法 权 
联邦 法 院 的 管辖 范围 
叛国 罪 
州 和 联邦 政府 

第 一 款 ”各州 的 官方 法 律 


第 二 款 各州 的 公民 
RAR ”新 的 州 
第 四 款 ”对 各 州 保护 的 保证 
第 五 条 BER 
第 六 条 ”总 体 保障 
第 七 条 ”宪法 的 批准 


宪法 作为 一 个 整体 是 最 高 层次 的 抽象 。 每 个 特定 的 条 处 理 
整体 的 一 部 分 ， 这 一 条 的 某 一 款 讲 述 一 个 特定 的 主题 ， 抽 象 层 
次 最 低 。 这 个 大 纲 从 逻辑 上 对 这 些 主题 进行 了 组 织 。 

1-4 用 肉 套 图 展示 了 宪法 大 纲 的 结构 ， 外 层 的 大 方 框 代 
KETER, CERET? 个 小 一 点 的 方 框 代 表 “ 条 ”， 每 
“条 ”里 面 的 方 框 代 表 “ 款 ”。 

这 种 对 文档 组 织 列 大 纲 的 方法 在 计算 机 科学 中 也 是 很 重要 
的 。 按照 大 纲 格式 组 织 程序 和 信息 的 技术 称 为 结构 化 程序 设计 
( structured programming)。 这 和 语文 作文 老师 教 你 在 写作 细节 
之 前 先 按照 大 纲 的 格式 组 织 好 报告 是 一 样 的 道理 ， 软 件 设 计 者 
先 组 织 好 程序 大 纲 ， 再 填写 编程 细节 。 


1.1.3 机构 中 的 抽象 


公司 机 构 是 另 一 个 用 到 抽象 层次 概念 的 领域 。 例 如 ， 图 1-5 
是 一 个 假想 的 教材 出 版 公司 以 层次 结构 图 表示 的 部 分 组 织 结构 。 
公司 总 裁 在 最 高 的 层次 ， 对 整个 机 构 的 成 功 运营 负责 。4 个 副 
总 裁 向 总 裁 汇 报 ， 每 个 副 总 裁 只 负责 一 个 主要 的 运营 部 门 。 在 
每 个 经 理 和 副 总 裁 下 面 还 有 更 多 的 层次 ， 本 图 中 没有 展示 出 来 。 图 1.4 ”美国 宪法 的 嵌 套 图 








大 学 部 副 总 裁 中 学 部 副 总 裁 小 学 部 副 总 裁 专业 图 书 副 总 裁 


东北 地 区 销售 经 理 | | 南部 地 区 销售 经 理 | | 西部 地 区 销售 经 理 


图 1-5 一 个 假想 出 版 公司 的 简化 组 织 示 意图 
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机 构 组 织 结构 图 中 的 层级 对 应 机 构 中 相应 的 责任 和 权力 。 总 裁 代 表 整 个 公司 的 利益 ， 给 
那些 向 她 汇报 的 人 授予 相应 的 责任 和 权力 。 那 些 人 再 运用 
他 们 的 权力 去 管理 组 织 中 其 负责 的 部 门 ， 还 可 以 向 员工 授 
予 相应 的 责任 。 在 企业 中 ， 每 个 人 拥有 的 实际 权力 可 能 并 
不 能 由 他 们 在 官方 结构 图 中 的 位 置 直接 反映 。 图 1-6 的 层 
次 图 显示 了 机 构 中 的 权力 级 别 。 在 这 条 命令 链 上 ， 副 总 裁 
向 总 裁 汇 报 ， 总 监 向 副 总 裁 汇 报 ， 经 理 向 总 监 汇报 。 

类 比 机 构 组 织 结 构图 反映 机 构 的 组 织 结构 功能 , 计算 ”图 1-6 图 1-5 所 示 机 构 的 层次 图 
机 系统 功能 也 可 以 按照 类 似 的 关系 图 反映 出 来 。 就 像 一 个 
大 的 机 构 ， 一 个 大 的 计算 机 系统 一 般 是 按照 层次 结构 来 组 织 的 。 计 算 机 系统 中 任何 一 部 分 都 
接收 来 自 层次 结构 图 中 它 的 直接 上 级 的 命令 。 然 后 ， 它 把 需要 执行 的 指令 分 发 给 层次 结构 中 
的 直接 下 级 。 


1.1.4 机 器 中 的 抽象 


另 一 个 抽象 层次 的 例子 是 和 计算 机 系统 非常 类 似 的 汽车 。 与 计算 机 系统 一 样 ， 汽 车 是 一 
台 人 造 机 器 。 它 由 发 动机 、 变 速 器 、 电 气 系统 、 制 冷 系统 和 底盘 组 成 ， 每 部 分 被 进一步 细 
分 ， 其 中 电气 系统 包括 电池 、 前 照 灯 、 稳 压 器 以 及 其 他 一 些 部 件 。 

和 汽车 相关 的 人 位 于 不 同 的 抽象 层次 。 驾 驶 者 位 于 最 高 的 抽象 层次 ， 驾 驶 者 了 解 如 何 驾 
驶 汽车 ， 例 如 怎样 启动 、 怎 样 加 速 、 怎 样 刹 车 。 

抽象 的 下 一 层次 是 初级 机 械 师 。 与 一 般 的 司机 相 比 ， 他 们 知道 更 多 发 动机 盖 下 面 的 细 
节 ， 知 道 怎么 换 机 油 和 火花 塞 ， 但 他 们 不 需要 知道 有 关 驾 驶 汽车 的 细节 知识 。 

抽象 的 再 下 一 层次 是 高 级 机 械 师 ， 他 们 可 以 完整 地 拆 印发 动机 ， 拆 解 、 修 理 并 把 它 再 组 
装 到 一 起 。 如 果 只 是 简单 地 更 换 机 油 并 不 需要 知道 这 些 细节 知识 。 

同样 的 道理 ， 与 计算 机 系统 相关 的 人 也 位 于 不 同 的 抽象 层次 ， 使 用 计算 机 不 需要 完全 民 
得 计算 机 的 每 个 抽象 层次 。 你 不 需要 成 为 机 械 师 才能 开车 。 同 样 ， 如 果 只 想 使 用 文字 处 理 软 
件 ， 你 不 需要 成 为 经 验 丰富 的 程序 员 。 | 


1.1.5 计算 机 系统 中 的 抽象 


图 1-7 展示 了 一 个 典型 的 计算 机 系统 的 层次 结构 。 图 
中 的 每 一 层 都 有 它 自 己 的 语言 : 

第 7 层 (App7): 与 应 用 程序 有 关 的 语言 

第 6 层 (HOL6 ): 与 机 器 无 关 的 编程 语言 

第 5 层 (Asmb5 ): 汇编 语言 

第 4 层 (OS4 ): 操作 系统 调用 

第 3 层 (ISA3 ): 机 器 语言 

2 Æ (Mc2): Perea eee B17 MRR 

第 1 层 (LG1): 布尔 代数 和 真 值 表 D TERRIERE 

用 这 些 语言 编写 的 程序 指示 计算 机 执行 一 定 的 操作 。 人 
一 个 执行 特定 任务 的 程序 可 以 用 图 1-7 中 任 一 层次 的 语言 编写 。 与 汽车 一 样 ， 一 个 用 某 一 层 
语言 写 程序 的 人 ， 不 必 懂 得 任何 更 低层 的 语言 。 
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发 明 计算 机 时 ， 只 有 LGI 和 ISA3 这 两 层 。 人 们 要 想 与 这 些 机 器 通信 ， 就 必须 在 指令 集 
架构 层 上 用 机 器 语言 (machine language) 对 它们 编程 。 机 器 语言 对 于 机 器 来 说 很 好 ， 但 是 对 
于 人 类 程序 员 来 说 单调 乏味 而 且 很 不 方便 。 于 是 Asmb5 层 的 汇编 语言 (assembly language) 
应 运 而 生 ， 以 便 帮助 人 类 程序 员 。 

最 早 的 计算 机 巨大 且 昂 贵 。 当 一 个 程序 员 占 用 计算 机 时 ， 其 他 的 用 户 就 必须 排队 等 候 ， 
这 浪费 了 大 量 的 时 间 。 慢 慢 地 ， 人 们 开发 出 了 OS4 层 的 操作 系统 (operating system)， 这 样 
许多 用 户 可 以 同时 访问 计算 机 。 对 于 今天 的 个 人 计算 机 来 说 ， 即 使 只 服务 一 个 用 户 ， 操 作 系 
统 仍然 是 管理 程序 和 数据 所 必需 的 。 

早期 ， 每 次 当 一 家 公司 介绍 一 款 新 发 布 的 计算 机 模型 时 ， 程 序 员 就 不 得 不 学 习 那 个 模 
型 的 汇编 语言 。 他 们 为 旧 机 器 所 写 的 所 有 程序 都 不 能 在 新 机 器 上 使 用 。 于 是 ， 人 们 发 明了 
HOL6 层 的 高 级 语言 (high-order language)， 这 样 程序 可 以 不 怎么 改动 就 从 一 种 计算 机 转移 
到 另 一 种 计算 机 上 ， 而 且 用 高 级 语言 编程 比 用 低级 语言 编程 容易 。 你 可 能 熟悉 下 面 这 些 流行 
的 HOL6 层 的 语言 : 

o C， 操 作 系统 编程 。 

e _ C++， 一般 应 用 程序 ; 在 C 的 基础 上 增加 了 面向 对 象 的 特性 。 

e Python, Web 应 用 程序 的 脚本 语言 。 

e Java, i FAM Web 应 用 程序 。 

计算 机 系统 的 广泛 使 用 促使 人 们 开发 出 了 许多 App7 层 的 应 用 程序 ， 这 些 程序 也 被 称 为 
app。 编 写 应 用 程序 (application program) 是 为 了 解决 特定 类 型 的 问题 ， 比 如 撰写 文档 、 统 
计 分 析 数 据 或 者 将 车 辆 导航 到 目的 地 。 这 使 得 你 可 以 把 计算 机 当 作 工具 来 使 用 而 无 须知 道 更 
低层 上 的 操作 细节 。 

最 底层 LG1 由 称 作 逻辑 门 (logic gate) 的 电子 组 件 组 成 。 在 向 更 高 层 发 展 的 过 程 中 ， 人 
们 发 现在 逻辑 门 层 上 设置 一 个 新 的 层次 是 非常 有 用 的 ， 它 能 够 帮助 设计 者 构建 IJSA3 层 的 机 
器 。 在 现在 的 一 些 计 算 机 系统 中 ,使 用 Mc2 层 的 微 程序 设计 ( microprogramming) 来 实现 
ISA3 层 的 机 器 。Mec2 层 是 发 明 手 持 式 计算 器 的 一 种 重要 工具 。 

学 习 本 书 的 目的 是 与 计算 机 进行 有 效 的 沟通 。 为 了 实现 这 个 目标 ， 你 必须 学 习 计 算 机 语 
。 较 高 层 的 语言 比 低层 的 语言 更 人 性 化 ， 更 易于 理解 ， 这 也 正 是 人 们 发 明 它们 的 原因 。 
在 学 习 本 书 时 ， 你 会 通过 不 断 审 视 较 低层 的 抽象 来 了 解 计算 机 系统 内 部 的 工作 原理 。 进 
入 的 层次 越 低 ， 你 就 会 发 现 越 多 在 更 高 层 中 被 隐藏 的 细节 。 在 不 断 学 习 的 过 程 中 ， 你 要 牢记 
图 1-7。 你 要 掌握 大 量 貌 似 琐碎 的 细节 ， 这 是 不 可 避免 的 。 不 过 你 要 记 住 : 计算 机 科学 的 美 
不 在 于 细节 的 多 样 ， 而 在 于 概念 的 统一 。 


1.2 硬件 


我 们 构建 计算 机 是 为 了 解决 问题 。 早 期 的 计算 机 主要 解决 数学 和 工程 问题 ， 后 来 的 计算 
机 强调 商业 应 用 的 信息 处 理 ， 今 天 ， 计 算 机 也 控制 各 种 诸如 汽车 发 动机 、 机 器 人 和 微波 炉 之 
类 的 机 器 。 计 算 机 系统 通过 接收 输入 、 处 理 输入 并 生成 输出 来 解决 这 些 领域 的 问题 。 图 1-8 
说 明了 计算 机 系统 的 功能 。 

计算 机 系统 由 硬件 和 软件 组 成 。 硬 件 (hardware) 
是 系统 的 物理 组 成 部 分 ， 一 旦 设计 好 ， 更 改 它 会 很 困难 
目 昂贵 。 软 件 (software) 是 一 组 程序 ， 它 指示 硬件 进 图 1.8 计算 机 系统 的 三 种 活动 
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行 工作 ， 比 硬件 容易 修改 。 与 只 能 解决 一 种 问题 的 专用 机 器 相 比 ， 计 算 机 的 价值 在 于 它 是 可 
以 解决 许多 不 同 问题 的 通用 机 器 。 通 过 给 系统 提供 不 同 的 指令 集 ， 即 不 同 的 软件 ， 用 相同 的 
硬件 可 以 解决 不 同 的 问题 。 

每 台 计 算 机 有 3 个 基本 的 硬件 
组 件 : 

o 中 央 处 理 单元 (CPU) 

o 主 存储 器 

© i 

图 1-9 以 框图 的 形式 展示 了 这 些 
组 件 。 方 框 之 间 的 线 代 表 信 息 流 。 系 
统 总 线 是 一 组 连接 组 件 的 线路 ， 信 息 
通过 系统 总 线 (bus) 从 一 个 组 件 流 系统 总 线 
向 另 一 个 组 件 。 上 述 重 件 组 件 列表 是 图 1-9 计算 机 系统 三 组 件 的 框图 
按照 存储 器 容量 递增 的 顺序 给 出 的 
CPU 的 存储 容量 最 小 ， 磁 盘 的 存 傅 
容量 最 大 。 而 列表 中 速度 的 顺序 则 是 递减 的 : CPU 的 速度 最 快 ， 磁 盘 的 速度 最 慢 。 


1.2.1 中央 处 理 单元 


中 央 处 理 单元 (Central Processing Unit, CPU) 包括 控制 计算 机 所 有 其 他 部 分 的 电路 。 
它 包 括 一 小 组 存储 器 ， 称 为 寄存 器 ( register)， 在 图 1-9 中 表示 为 CPU 方 框 中 的 两 个 小 框 。 
虽然 图 中 只 给 出 了 两 个 寄存 器 ,但 通常 它们 的 数量 从 16 到 64 AS. CPU 电路 中 也 永久 固 
化 有 一 组 指令 。 这 些 指令 完成 的 工作 有 : 从 主 存储 器 获取 信息 到 寄存 器 、 加 、 减 、 比 较 、 把 
信息 从 寄存 器 存储 回 主 存储 器 等 。 指 令 执行 的 顺序 不 是 固定 不 变 的 ， 这 由 ISA3 层 机 器 语言 
编写 的 程序 来 决定 。 

CPU 如 何 处 理 信息 的 一 个 例子 是 简单 赋值 语句 j=i+1 的 执行 ,这 条 编程 语句 用 HOL6 层 
的 语言 (如 CC 或 Java) 编写 。 它 将 整数 变量 i 加 1， 再 将 和 数 赋值 给 j。 程 序 执 行 时 ， 系 统 
把 变量 1 和 j 的 值 存储 到 主 存储 器 。HOL6 层 上 只 一 条 j=i+l 语句 ， 翻 译 到 ISA3 层 就 变 为 
三 条 语句 ， 这 其 中 的 每 一 条 语句 都 是 已 经 固化 到 CPU 的 一 条 指令 。 第 一 条 指令 从 主 存储 器 
取 i 的 当前 值 送 到 CPU 寄存 器 ， 如 图 1-10a 所 示 。 信 息 流 从 主 存储 器 的 存储 单元 到 系统 总 
线 ， 然 后 进入 CPU 的 寄存 器 。 第 二 条 指令 将 寄存 器 中 的 值 加 1， 这 条 指令 完全 在 CPU 内 执 
行 ， 不 涉及 系统 总 线 上 的 信息 流 。 第 三 条 指令 把 加 1 后 的 值 存 回 主 存储 器 中 j 的 位 置 ， 如 
图 1-10b 所 示 。 






中 央 处 理 单元 





a) 第 一 条 ISA3 层 指令 : Bi 的 值 b) 第 三 条 ISA3 层 指令 : 存 和 数 到 j 
图 1-10 执行 HOL6 层 语 句 j=i+1 的 信息 流 
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1.2.2 ERE 

与 CPU 一样， 主 存储 器 (main memory， 简 称 主 存 ) 也 有 一 组 存储 单元 来 存储 信息 。 但 
它 与 CPU 有 两 个 地 方 不 同 。 其 一 ， 存 储 单元 的 数量 远 远 大 于 CPU 中 的 单元 数量 。 图 1-9 在 
主 存 中 只 显示 了 五 个 存储 单元 ,但 一 部 智能 手机 就 可 以 拥有 几 亿 个 存储 单元 ， 而 一 台 笔 记 本 
电脑 则 拥有 超过 100 亿 个 存储 单元 。 与 这 样 庞大 的 数量 相 比 ， 典 型 CPU 中 只 有 几 十 个 寄存 
Ae HEL, CPU 有 一 组 固化 到 电路 中 的 指令 对 其 寄存 器 中 的 数据 进行 处 理 。 尽 管 主 存 的 存 
储 容量 远大 于 CPU 的 存储 容量 ， 但 它 不 能 处 理 保 存在 其 中 的 数值 。 它 具备 的 唯一 功能 就 是 
记 住 存储 在 存储 单元 中 的 数据 值 ， 并 按照 请 求 向 CPU 或 磁盘 提供 这 些 数值 。 

主 存 保存 四 类 信息 : 

© CPU 处 理 的 数据 

© CPU 执行 的 程序 指令 

e 从 外 部 环境 接收 数据 的 输入 连接 

o 向 外 部 环境 发 送 数 据 的 输出 连接 

数据 存储 的 一 个 例子 是 图 1-10 中 的 i 和 j 的 整数 值 。 在 之 后 的 执行 中 ， 如 果 程 序 的 另 一 
次 计算 需要 j 值 ， 主 存 将 原封 不 动 地 传递 之 前 存储 的 数值 。 

当 购 买 一 个 应 用 程序 (比如 文字 处 理 器 ) 的 时 候 ， 将 其 下 载 到 磁盘 ， 一 直到 你 想 要 使 
用 该 程序 时 ， 它 都 会 被 存储 在 磁盘 上 。 当 执行 该 应 用 程序 时 ， 计 算 机 系统 把 程序 的 一 个 副 
本 从 磁盘 发 送 到 主 存 。 不 论 是 什么 时 候 ， 主 存 都 包含 了 在 系统 中 正在 执行 的 所 有 应 用 程序 
的 副本 。 所 以 ， 除 了 图 1-10 中 变量 1 和 j 的 数值 之 外 ， 主 存 还 存储 了 应 用 程序 的 指令 。 由 
于 CPU 包含 了 执行 应 用 程序 指令 的 电路 ， 因 此 计算 机 系统 在 执行 指令 之 前 ， 必 须 从 主 存 中 
取 指 令 。 图 1-11 给 出 了 取 指 令 的 信息 流 。 该 信息 流 
与 图 1-10a 类 似 ， 要 经 过 系统 总 线 ， 只 不 过 信息 来 
源 不 再 是 i 的 存储 位 置 ， 而 是 指令 的 存储 位 置 。 该 
指令 被 复制 到 CPU 的 专用 寄存 器 间 令 寄存 器 
(instruction register) 中 。CPU 中 的 电路 设计 用 于 分 
析 并 执行 指令 寄存 器 中 的 指令 。 

主 存 中 有 一 些 单元 被 保留 下 来 用 于 输入 /输出 连 
接 ， 这 种 技术 被 称 为 内 存 映射 的 输入 /输出 ,或 内 存 
映射 10。 键 盘 是 常见 的 映射 到 主 存 的 输入 设备 。 当 
在 键盘 上 按 下 一 个 键 时 ， 键 盘 电路 检测 被 按 下 的 是 
哪个 键 ， 并 将 代表 该 按键 符号 的 信息 传送 给 主 存 的 
输入 连接 。 然 后 键盘 向 CPU 发 出 一 个 信号 表示 有 按 
键 被 按 下 。CPU 响应 该 通知 信号 ， 从 输入 连接 取出 
字符 以 便 处 理 。 图 1-12 展示 了 从 键盘 接收 一 个 字符 
的 信息 流 。 与 从 主 存 中 取 数 据 或 指令 的 信息 流 相 同 ， 
输入 信息 流 沿 系统 总 线 到 达 CPU。 唯 一 的 区 别 是 信 
息 来 自 于 固化 到 主 存 存储 单元 中 的 键盘 输入 连接 。 

图 1-12 可 能 给 人 这 样 一 种 印象 ， 即 计算 机 系统 有 一 个 很 大 的 主 存 设备 ， 而 键盘 是 物理 
连接 到 这 个 设备 的 一 个 存储 单元 上 。 这 对 ISA3 层 的 程序 员 而 言 是 个 方便 的 模型 。 要 从 输入 
设备 获取 数据 ，ISA3 层 的 程序 员 可 以 编写 一 条 指令 从 输入 连接 取 数 据 ， 这 里 用 到 的 是 与 从 








图 1-12 ”从 键盘 接收 一 个 字符 的 信息 流 
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变量 获取 数据 值 一 样 的 编写 代码 的 技术 。 不 过 ，LG1 层 上 的 硬件 设计 师 使 用 了 多 个 独立 的 设 
备 来 构建 系统 的 主 存 ， 他 们 不 会 把 键盘 物理 连接 到 单个 中 央 存 储 设备 的 存储 单元 上 ， 而 是 会 
把 键盘 连接 到 系统 总 线 上 ， 这 样 一 来 ， 在 ISA3 层 程序 员 眼 中 就 只 有 一 个 存储 设备 了 。 这 种 
抽象 对 ISA3 层 程 序 员 隐藏 了 LGI1 层 的 连接 细节 。 

鼠标 、 和 触 控 板 和 触摸 屏 是 另外 三 种 常见 的 输入 设备 。 在 鼠标 内 部 有 一 个 小 型 发 光 二 极 
管 ， 它 将 一 束 光线 投射 到 桌面 上 。 光 线 反 射 回 一 个 每 秒 采样 1500 次 的 传感器 ， 鼠 标 里 有 一 
个 数字 信和 号 处 理 器 ， 它 像 一 个 被 编程 为 只 处 理 一 项 任务 的 微小 计算 机 ， 探 测 桌面 或 者 鼠标 垫 
图 像 中 的 模式 ， 并 确定 从 上 次 采样 到 现在 它们 移动 了 多 远 。 鼠 标 中 的 这 个 处 理 器 从 模式 中 计 
算 鼠 标的 方向 和 速度 ， 然 后 通过 输入 连接 把 这 些 数据 发 送 到 计算 机 ， 计 算 机 再 在 显示 器 上 显 
示 光 标 图 像 。 

计算 机 系统 中 最 明显 的 输出 设备 是 屏幕 ， 其 他 设备 还 包括 用 于 音频 输出 的 扬声器 和 用 于 
硬 拷贝 输出 的 打印 机 。 在 小 型 系统 如 手持 式 计算 器 中 ， 主 存 对 每 个 计算 器 能 显示 的 数字 或 字 
母 都 有 一 个 输出 连接 。 计 算 器 计算 出 要 显示 的 数字 后 ， 就 把 该 数字 的 每 个 字符 都 发 送 到 相应 
的 输出 连接 。 比 如 ， 如 果 要 显示 的 数字 是 263 ， 计 算 机 就 把 字符 2 发 送 到 第 一 个 输出 连接 ， 
字符 6 发 送 到 第 二 个 输出 连接 ， 字符 3 发 送 到 第 三 
个 输出 连接 。 图 1-13 展示 了 数字 中 一 个 字符 在 系统 
总 线 上 的 信息 流 。 

平板 电脑 和 个 人 计算 机 都 是 像素 显示 。 像 素 即 
图 像 元 素 ， 是 显示 屏 上 一 个 独立 的 点 。 系 统 通 过 设 
定 显 示 屏 上 每 个 独立 像素 的 亮度 和 颜色 来 构成 一 幅 
图 像 。 打 印 机 则 是 通过 适当 混合 墨水 在 纸 上 为 每 个 
像素 着 色 来 构成 图 像 。 理 论 上 ,可 以 让 输出 设备 上 《” 图 1-13 发 送 数 据 到 输出 连接 的 信息 流 
的 每 个 像素 都 在 主 存 中 有 一 个 输出 连接 。 但 是 ， 典 
型 屏幕 有 大 约 1000 万 个 像素 ， 如 果 CPU 的 任务 是 连续 不 断 地 更 新 每 个 像素 到 正确 的 数值 ， 
它 就 没有 足够 的 时 间 去 执行 其 他 的 计算 任务 。 

因此 ， 主 存 的 显示 输出 连接 不 会 直接 连 到 显示 器 的 每 个 像素 ， 相 反 ， 它 们 与 包含 独立 的 
专用 处 理 器 的 IO 模块 相连 ， 这 些 处 理 器 的 唯一 功能 就 是 计算 显示 器 上 每 个 像素 的 颜色 值 。 
比如 要 在 显示 器 上 画 一 条 线 ，CPU 不 需要 计算 所 有 像素 的 颜色 值 来 呈现 这 条 线 ， 相 反 ， 它 
把 直线 的 端点 发 送 到 输出 连接 ， 然 后 IO 模块 就 可 以 根据 这 个 信息 来 计算 并 设置 显示 器 上 像 
素 的 颜色 值 。 


1.2.3 ”磁盘 


与 CPU 和 主 存 一 样 ， 磁 盘 也 用 一 组 存储 单元 来 保存 信息 。 它 与 主 存 的 差异 有 三 点 。 第 
一 ， 主 存 是 易 失 性 的 。 这 是 指 ， 当 关 掉 电源 或 断 电 时 ， 主 存 中 的 数值 会 丢失 。 与 之 相反 ， 磁 
盘 是 非 易 失 性 的 。 将 信息 存储 到 磁盘 时 ， 若 关 掉 电源 ， 等 到 再 开启 电源 后 ， 信 息 仍 然 存在 。 

第 二 ， 磁 盘 的 存储 容量 大 约 是 主 存 容 量 的 1000 倍 。 主 存 中 的 存储 单元 数量 通常 为 数 十 
亿 ， 而 磁盘 中 的 单元 数量 通常 为 数 万 亿 。 

第 三 ， 虽 然 磁盘 有 巨大 的 存储 容量 ， 但 它 的 速度 却 比 主 存 慢 。 造 成 这 种 速度 差异 的 原因 
是 对 两 种 存储 器 不 同 的 访问 方式 。 对 主 存 的 访问 是 随机 的 ， 实 际 上 构成 主 存 的 电子 部 件 通常 
被 称 为 RAM (随机 访问 存储 器 ) 电路 。 假 如 刚刚 从 主 存 的 一 端 取 了 一 些 信息 ， 你 还 可 以 立 
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即 从 男 一 端 随机 地 获取 信息 ， 而 不 用 在 两 端 之 间 传 递 信息 。 

与 之 相反 的 是 ,磁盘 的 访问 方式 是 顺序 的 。 硬 盘 包 含 了 旋转 的 盘 片 ， 其 表面 薄 薄 的 磁性 
涂 层 用 于 保存 信息 。 一 个 微型 传感器 掠 过 磁盘 表面 ， 从 磁盘 的 中 心 向 边缘 移动 ， 定 位 到 信息 
保存 的 位 置 。 如 果 你 刚 从 靠近 磁盘 中 心 的 位 置 得 到 信息 ， 就 不 能 从 磁盘 边缘 获取 信息 ， 除 非 
先 将 传感器 向 边缘 移动 ， 然 后 等 待 信息 旋转 到 传感器 下 方 。 将 传感器 移动 到 正确 位 置 所 花 的 
时 间 称 为 寻 道 时 间 ， 等 待 信息 旋转 到 传感器 下 方 所 花 的 时 间 称 为 延迟 (latency)。 这 些 时 间 
通常 是 几 千 分 之 一 秒 ， 而 从 RAM 访问 数值 的 时 间 一 般 是 几 十 亿 分 之 一 秒 。 因 此 ， 磁 盘 比 主 
存 慢 了 大 约 100 万 倍 。 

固态 硬盘 (SSD) 执行 的 功能 与 硬盘 相同 ， 但 它 全 部 电子 化 了 ， 没 有 移动 部 件 。 它 的 存 
储 容量 没有 硬盘 大 ， 可 是 由 于 没有 移动 部 件 ， 其 速度 却 大 约 比 硬盘 快 一 百倍 。 出 于 同样 的 原 
因 ， 它 的 可 靠 性 也 更 高 。 不 过 ， 即 便 如 此 SSD 比 内 存 还 是 慢 了 数 千 倍 。 

图 1-14 展示 了 磁盘 与 主 存 通 过 系统 总 线 传递 的 信息 流 。 与 之 前 图 示 信 息 流 不 同 的 是 ， 
CPU 不 介入 传送 过 程 。 磁 盘 与 主 存 间 不 通过 CPU FF 
存 器 的 信息 传输 被 称 为 直接 内 存 访 问 (DMA )。 磁 盘 
有 自己 的 专用 处 理 器 DMA 控制 器 ， 其 唯一 的 功能 就 
是 通过 系统 总 线 在 磁盘 与 主 存 之 间 传 输 信息 。CPU 
向 DMA 控制 器 发 送信 号 启动 传输 请 求 ， 然 后 ， 当 
CPU 处 理 其 寄存 器 中 的 信息 时 ，DMA 控制 器 同时 在 
总 线 上 传输 信息 。 传 输 结 束 后 磁盘 控制 器 向 CPU 发 
送信 号 。 图 1-14 磁盘 与 主 存 间 的 直接 内 存 访问 

假设 现 有 一 个 文档 需 在 文字 处 理 器 中 编辑 ， 而 
文字 处 理 器 应 用 程序 存储 在 磁盘 上 。 当 该 应 用 程序 启动 时 ， 系 统 用 DMA 传输 把 它 的 副本 从 
磁盘 发 送 到 内 存 ， 如 图 1-14 所 示 。 之 后 ， 当 打开 文档 时 ， 系 统 完成 同样 的 传输 ， 把 文档 送 
入 内 存 。 在 键盘 上 敲 击 一 个 按键 并 在 显示 屏 上 查看 结果 的 信息 流 如 图 1-12 和 图 1-13 所 示 。 
保存 文档 时 ， 系 统 实现 的 DMA 传输 与 图 1-14 相似 ， 只 是 传送 方向 相反 ,文档 从 内 存 传输 
到 磁盘 。 


1.3 软件 


算法 (algorithm ) 是 一 组 指令 ， 按 照 适 当 的 顺序 执行 ， 在 有限 的 时 间 内 解决 一 个 问题 。 
算法 并 不 一 定 需要 计算 机 。 图 1-15 是 一 个 用 中 文 表 达 的 算法 ,解决 制作 6 份 搅拌 奶油 冻 的 
问题 。 

这 份 食谱 说 明了 算法 的 两 个 重要 性 质 ， 即 有 限 数量 的 指令 和 在 有 限时 间 内 执行 。 这 个 算 
法 有 7 条 指令 : 混合 、 搅 拌 、 亮 调 、 关 火 、 冷 却 、 添 加 和 和 放 凉 。7 是 一 个 有 限 的 数量 。 算 法 
中 指令 的 数量 不 能 是 无 限 的 。 

尽管 奶油 冻 算 法 的 指令 数量 是 有 限 的， 但 是 它 的 执行 有 一 个 潜在 的 问题 。 食 谱 告 诉 我 们 
一 直 蒸 到 蛋 奶 能 够 庄 住 金属 汤匙 ， 但 是 如 果 它 一 直 不 能 囊 住 汤匙 怎么 办 呢 ? 那么 如 果 严 格 遵 
照 指 令 ， 我 们 就 要 一 直 蒸 下 去 ! 一 个 有 效 的 算法 绝 不 能 无 休止 地 执行 。 它 必须 提供 一 个 在 有 
限时 间 内 解决 问题 的 方案 。 假 设 奶 油 总 是 能 庄 住 汤匙 ， 那 么 这 个 食谱 就 是 真正 的 算法 了 。 

程序 ( program) 是 在 计算 机 上 执行 的 算法 。 程 序 不 能 用 自然 语言 编写 ， 必 须 用 计算 机 
系统 的 7 层 之 一 的 语言 编写 。 
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配料 : 
3 个 轻微 搅 打 的 鸡蛋 
1/4 杯 砂 糖 
2 杯 牛奶 ， 者 沸 
1/2 茶匙 香草 
算法 : 
将 鸡蛋 、 白 砂糖 和 1/4 茶匙 盐 混 合 


倒 人 略微 冷却 的 牛奶 并 缓慢 搅拌 

在 已 热 但 未 沸腾 的 水 上 ， 用 双 层 蒸 锅 蒸 制 ， 在 此 期 间 不 断 抄 拌 
只 要 奶油 冻 能 庄 住 金属 汤匙 的 表面 就 关 火 

立即 冷却 ， 将 平底 锅 放 入 冷水 ， 并 搅拌 1 ~ 2 分 钟 

加 入 香草 

放 凉 即 可 





图 1-15 制作 搅拌 奶油 冻 的 算法 


通用 计算 机 可 以 解决 不 同 种 类 的 问题 ， 从 计算 公司 的 工资 表 到 修正 备忘录 中 的 拼写 错 
误 。 我 们 能 够 对 硬件 编程 让 它 做 不 同 的 事情 ， 硬 件 的 多 功能 正 是 来 源 于 此 。 控 制 计 算 机 的 程 
序 称 为 软件 (software ) 。 

软件 分 为 两 大 类 : 

e 系统 软件 

e 应 用 软件 

系统 软件 (system software) 使 应 用 设计 者 可 以 访问 计算 机 。 同 样 的 道理 ， 应 用 软件 

( applications software) 使 位 于 App7 层 的 终端 用 户 可 以 访问 计算 机 。 一 般 来 说 ， 系 统 软件 工程 师 

在 HOL6 层 和 更 低层 设计 程序 ， 这 些 程序 处 理 计算 机 系统 中 应 用 程序 员 不 想 费 心 的 许多 细节 。 


1.3.1 操作 系统 


计算 机 最 重要 的 软件 是 操作 系统 ， 操 作 系 统 (operating system) 是 使 硬件 可 用 的 系统 程 
序 。 每 个 通用 计算 机 系统 都 包括 硬件 和 一 个 操作 系统 。 

为 了 有 效 地 学 习 本 书 ， 你 必须 能 够 访问 一 台 有 操作 系统 的 计算 机 。 一 些 常 用 的 商用 操 
作 系 统 包 括 Microsoft Windows, Mac OS X, Linux, Android 和 iOS. Mac OS X FI iOS 是 
Unix 操作 系统 ，Android 是 基于 Linux 的 ， 而 Linux 也 是 一 种 Unix. 

操作 系统 有 3 个 通用 功能 : 

e 文件 管理 

o 存储 器 管理 

o 处 理 髓 管理 

在 3 个 功能 中 ， 对 用 户 来 说 文件 管理 是 最 直观 的 。 计 算 机 新 手 要 学 会 的 第 一 件 事 情 就 是 
如 何 操 作 操 作 系 统 中 的 信息 文件 。 

操作 系统 中 的 磁盘 、 目 录 和 文件 就 好 比 办 公 室 中 的 文件 柜 、 文 件 夹 和 文件 一 样 。 在 办 公 
室 中 ， 文 件 柜 保存 文件 夹 ， 文 件 夹 中 放 的 是 一 组 文件 。 在 操作 系统 中 ， 磁 盘 保存 目录 ， 每 
个 目录 下 包含 了 一 组 文件 。 办 公 室 工作 人 员 为 每 个 文件 夹 分 配 一 个 名 称 来 表明 该 文件 夹 的 内 
容 ， 同 时 也 易于 从 文件 柜 中 挑选 一 个 单独 的 文件 。 同 样 ， 计 算 机 用 户 为 目录 分 配 一 个 名 称 来 
表明 该 目录 的 内 容 ， 同 时 也 可 以 轻松 地 选择 要 在 应 用 程序 中 打开 的 文件 。 

文件 可 以 包含 3 种 类 型 的 信息 : 
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。 文档 

o 程序 

e 数据 

文档 可 以 是 公司 备忘录 、 音 乐 、 照 片 等 。 文 件 也 可 以 存储 计算 机 执行 的 程序 。 要 执行 程 
序 时 ， 首 先 要 把 它们 从 磁盘 加 载 到 主 存 中 ， 如 图 1-14 所 示 。 一 个 正在 执行 程序 的 输入 数据 
可 以 来 自 文件 ， 而 输出 数据 也 可 以 发 送 到 文件 。 

物理 上 文件 散布 在 磁盘 的 表面 。 为 了 记录 所 有 这 些 信息 文件 ， 操 作 系 统 维护 文件 的 目 
录 。 目 录 是 磁盘 上 所 有 文件 的 一 个 列表 ， 目 录 中 的 每 个 条 目 都 包括 文件 名 字 、 大 小 、 在 磁盘 
上 的 物理 位 置 和 其 他 任何 操作 系统 管理 文件 所 需 的 信息 。 目 录 本 身 也 存储 在 磁盘 上 。 

图 1-16 展示 了 一 个 典型 的 文件 系统 ， 从 用 户 的 角度 来 看 它 是 分 层 的 。 顶 端的 方 框 是 根 
目录 , 在 Unix 系统 中 标记 为 /。 在 它 的 下 面 有 三 个 目录 分 别 用 于 保存 应 用 程序 ， 应 用 程序 
使 用 的 软件 库 以 及 每 个 用 户 在 该 计算 机 上 的 登录 账户 。 每 个 用 户 又 有 独立 的 目录 用 于 保存 文 
档 、 音 乐 和 照片 等 文件 。 






ary 


图 1-16 一 个 典型 的 层次 化 文件 系统 


操作 系统 向 用 户 提供 了 一 种 操作 磁盘 上 文件 的 方法 。 常 见 的 操作 系统 命令 包括 : 修改 文 
件 或 目录 名 称 ， 从 磁盘 删除 文件 ， 以 及 执行 应 用 程序 。 有 经 验 的 程序 员 可 以 在 终端 应 用 程 
序 上 以 命令 行 的 形式 来 执行 这 些 命 令 ， 而 大 多 数 用 户 则 是 以 点 击 鼠 标的 方式 来 启动 命令 。 你 
的 操作 系统 是 由 一 组 系统 程序 员 针 对 你 的 计算 机 编写 的 一 个 程序 。 当 你 发 出 从 磁盘 删除 一 个 
文件 的 命令 时 ， 系 统 程序 会 执行 这 条 命令 。 你 (作为 用 户 ) 正在 使 用 其 他 人 《【 即 系统 程序 员 ) 
写 的 一 个 程序 。 


1.3.2 ”软件 分 析 与 设计 


软件 ， 无 论 系统 软件 还 是 应 用 软件 ， 和 文学 有 很 多 共同 点 。 两 者 都 是 人 写 的 。 尽 管 计算 
机 也 能 读 并 执行 程序 ， 但 人 能 阅读 这 两 样 东 西 。 小 说 家 和 程序 员 都 很 有 创造 性 ， 因 为 他 们 提 
出 的 解决 方案 并 不 是 唯一 的 。 当 小 说 家 想 要 表达 某 些 东西 时 ， 总 是 有 不 止 一 种 表达 方式 。 好 
小 说 和 坏 小 说 之 间 的 差别 不 仅 体现 在 要 表达 的 主题 上 ， 还 体现 于 表达 的 方式 上 。 同 样 ， 程 序 
员 要 解决 一 个 问题 时 ， 解 决 方案 总 有 不 止 一 种 编程 方法 。 好 程序 和 坏 程 序 之 间 的 差别 不 仅 体 
现在 解决 方案 对 问题 解答 的 正确 性 上 ， 还 体现 在 程序 的 其 他 特性 上 ， 比 如 清晰 程度 、 执 行 速 
度 和 对 存储 器 的 要 求 。 

文学 专业 的 学 生 要 从 事 两 项 不 同 的 活动 一 一 阅读 和 写作 。 阅 读 是 分 析 ， 读 其 他 人 写 的 东 
西 并 分 析 它 的 内 容 。 写 是 设计 或 综合 ， 要 表达 一 个 观点 ， 你 需要 做 的 是 有 效 地 传达 这 个 观 
点 。 大 多 数 人 觉得 写 比 读 难 多 了 ， 因 为 它 要 求 有 更 多 的 创造 力 。 这 也 正 是 大 众 中 读者 比 作 家 
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多 的 原因 。 

类 伏地 ， 作 为 一 个 软件 专业 的 学 生 ， 你 将 分 析 和 设计 程序 。 要 牢记 程序 的 3 个 活动 是 输 
入 、 处 理 和 输出 。 在 分 析 时 ， 给 出 的 是 输入 和 处 理 指 令 ， 问 题 是 确定 输出 。 在 设计 时 ， 给 出 
的 是 输入 和 预期 的 输出 ， 问 题 是 写 出 处 理 指令 ， 这 就 是 软件 设计 。 图 1-17 展示 了 分 析 和 设 
计 之 间 的 不 同 。 


| 输入 | 处 理 | 输入 一 | 输出 | 
a) 分 析 一 一 给 定 输入 和 处 理 ， 确 定 输出 b) 设计 一 一 给 定 输入 和 预期 的 输出 ， 确 定 处 理 
图 1-17 分 析 与 设计 的 不 同 


如 同文 学 中 的 阅读 和 写作 ,设计 优秀 软件 比分 析 优 秀 软件 困难 很 多 。 计算 机 专业 的 学 生 
最 熟悉 的 抱怨 是 “我 能 理解 概念 ， 但 是 我 不 会 写 程序 -” 这 是 一 个 很 自然 的 抱怨 ， 因 为 它 反 
映 了 综合 相对 于 分 析 的 困难 之 处 。 我 们 的 终极 目标 是 让 你 既 能 够 分 析 软 件 也 能 够 设计 软件 。 
下 面 的 几 章 将 教 你 一 些 具体 的 软件 设计 技术 。 

不 过 ， 首 先 你 得 熟悉 求解 问题 的 一 般 性 指导 原则 ， 它 们 同样 适用 于 软件 设计 : 

。 理解 问题 

© 概括 解决 方案 

o 解决 概括 出 的 问题 的 各 个 部 分 

© 在 计算 机 上 测试 你 的 解决 方案 

面 对 一 个 软件 设计 问题 时 ， 通 过 写 下 一 些 样本 输入 和 相应 的 输出 ， 可 以 测试 你 对 问题 的 
理解 。 如 果 你 不 知道 怎么 手工 解决 一 个 问题 ， 就 不 可 能 通过 计算 机 解决 这 个 问题 。 要 概述 问 
题 的 解决 方案 ， 你 必须 把 问题 分 解 成 几 个 子 问题 ， 因 为 子 问题 比 原始 问题 小 ， 更 容易 解决 。 


14 数字 信息 


我 们 生活 在 时 空 宇 宙 中 ， 这 里 的 每 个 事件 都 发 生 在 一 个 特定 的 空间 点 和 特定 的 时 间 点 
上 。 因 此 ， 宇 宙 中 所 有 的 计算 也 要 包含 空间 和 时 间 。 计 算 机 系统 的 空间 是 由 芯片 电路 上 的 电 
子 设备 以 及 连接 它们 的 线路 构成 的 。 计 算 花 费 的 时 间 则 是 CPU 执行 程序 指令 的 时 间 加 上 信 
息 在 系统 组 件 间 传输 的 时 间 。 


1.4.1 空间 量化 


由 于 计算 机 是 电子 设备 ， 因 此 ， 信 息 以 电子 信号 的 形式 进行 存储 和 处 理 。 信 和 号 就 是 电 
子 线路 中 的 电压 等 级 。 每 个 信号 要 么 是 高 电 平 ， 用 数字 1 表示 ， 要 么 是 低 电 平 ， 用 数字 0 表 
示 。 由 于 信号 只 有 两 种 可 能 的 数值 ， 它 也 被 称 为 二 进 制 数字 或 位 (比特 )。 位 是 数字 信息 中 
最 小 的 单位 。 计 算 机 系统 中 的 每 一 位 都 占据 了 电路 中 的 空间 ， 该 电路 由 保持 位 的 数值 的 电子 
元 件 组 成 。 

大 多 数 数 据 值 表 示 的 是 数字 或 文本 。 要 处 理 这 样 的 数据 ， 计 算 机 系统 需 把 数字 和 文本 表 
示 为 位 序列 ， 而 序列 中 的 位 数 在 某 种 程度 上 是 任意 的 。 对 整数 而 言 ， 与 短 的 位 序列 相 比 ， 长 
的 位 序列 能 够 存储 更 大 的 数值 范围 。 对 文本 而 言 ， 长 的 位 序列 能 存储 更 多 的 字符 。 计 算 机 系 
统 不 同 部 分 的 位 序列 长 度 也 不 同 。 比 如 ，CPU 中 寄存 器 的 长 度 一 般 是 32 位 或 64 位 ,而 主 
存 中 存储 单元 的 长 度 则 总 是 8 位 。 

每 一 个 位 都 有 两 个 值 ，0 或 者 1， 因 此 ,存储 在 位 序列 中 数值 的 个 数 是 固定 的 ， 如 
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下 所 示 : 

e nn 位 序列 存储 数值 的 个 数 为 2 。 

例如 ， 图 1-18 给 出 了 3 位 序列 存储 的 所 有 可 能 的 数值 。 nT a 
因为 2=8， 所 以 3 位 序列 能 存储 8 个 数值 。 如 果 用 3 位 序列 5 jii 
来 表示 一 个 整数 ， 那 么 这 8 个 十 进 制 数值 就 为 0, 1, 2, …, 7。 i 001 

存储 一 个 英文 字符 需要 多 少 位 ? 字母 表 里 有 26 AFE, 2 010 
算 上 大 小 写 就 需要 2x26 个 ， 即 52 个 值 。 加 上 10 个 十 进 制 3 oll 
数字 0 一 9， 数 值 的 个 数 上 升 为 62 个 。 再 加 上 全 部 标点 符号 ， 4 100 
比如 ? 和 ! ， 大 约 十 几 个 左右 ， 总 数 达到 74 个 。 现 在 ，6 位 5 101 
已 经 不 够 了 ， 因 为 2 等 于 64， 而 我 们 最 少 需要 存储 74 个 6 ue 

7 111 


(A. 7 位 是 足够 的 ， 因 为 2 等 于 128， 超 过 了 我 们 需要 的 74 
个 存储 值 。 美 国信 息 交 换 标 准 代码 (ASCI) 指定 了 所 有 128 图 1-18 3 位 表示 的 8 个 数值 
个 可 能 的 二 进 制 值 ， 以 及 每 个 位 模式 对 应 的 英文 字符 。 把 文 

本 信息 存储 在 计算 机 系统 中 是 很 普遍 的 。 比 如 ， 计 算 机 把 小 

写字 母 q 存储 为 7 位 序列 1110001， 把 小 写字 母 + 存储 为 7 位 序列 1110010。 

一 个 8 位 的 序列 被 称 为 字 节 (byte)。 在 所 有 的 计算 机 系统 中 ， 一 个 主 存 的 存储 单元 就 是 
一 个 字 节 。 要 把 一 个 7 位 字符 放 人 一 个 8 位 的 存储 单元 中 ， 系 统 会 在 每 个 字符 的 7 位 编码 的 
前 面 加 上 一 个 额外 的 0。 这 样 一 来 ，q 就 被 保存 为 0111 0001, 
而 rt 就 被 保存 为 0111 0010。 经 验 法 则 如 下 : 





saith: 


e —* ASCII 字符 占 一 个 字 节 ， 即 8 位 。 a 

图 1-19 显示 了 代表 小 量 的 常见 公制 前 级 。 使 用 小 量 前 10* mico 
缀 的 一 个 例子 是 把 硬盘 寻 道 时间 表 述 为 12ms。 图 中 所 示 前 ace ae OE 
ATE m 是 milli- 的 缩写 ， 所 以 寻 道 时 间 应 为 12 毫秒 ， 即 10 pico- p 
12x103 秒 ,或 0.012 秒 。 同 样 ， 如 果 存 储 设备 的 访问 时 间 ”图 1-19 科学 记 数 法 中 的 小 
为 430ns， 就 等 于 是 430 x 10° Pak 0.000 000 43 秒 。 数 前 绥 


图 1-20a 中 表示 大 数 的 十 进 制 前 缀 在 科学 领域 中 也 很 常 
见 。 比 如 ，45MW 就 是 指 45 兆 瓦 或 45 x 10f 瓦 。 这 些 前 缀 同样 常用 于 指定 硬盘 容量 ,但 是 ， 
对 其 他 指定 存储 容量 就 不 那么 常见 了 ， 因 为 这 些 设备 的 访问 方式 是 二 进 制 的 。 因 此 ， 计 数 时 
通常 以 2 为 基数 ， 而 不 是 以 10 为 基数 。 为 了 区 分 这 两 个 计数 基 值 ， 二 进 制 前 缀 改 为 在 相应 
的 十 进 制 前 级 的 后 面 加 上 小 写字 母 i。 图 中 二 进 制 前 级 中 的 kilo- 指定 为 kibi-， 表 示 的 数值 
为 2" 或 1024; 二 进 制 mega- 为 2” 或 1024 。 图 1-20b 给 出 了 十 进 制 和 相应 二 进 制 倍数 的 精 
确 值 。 对 第 一 个 倍数 来 说 ，1000 和 1024 之 间 的 误差 小 于 3%， 因 此 你 可 以 把 二 进 制 的 kilo- 
或 kibi- 理解 为 1000， 尽 管 它 稍微 大 一 点 。mega- 的 误差 要 略 大 一 些 ， 但 是 也 还 是 在 5% 以 
内 。 同 样 适用 的 还 有 giga-、tera- 和 peta-， 只 不 过 peta- 的 误差 约 为 12.6%。 

字 节 的 缩写 是 大 写字 母 B， 位 的 缩写 是 小 写字 母 b。 举 个 例子 ， 按 照 标准 的 giga- 含义 ， 
容量 为 780GB 的 硬盘 可 以 存储 780x10 个 字 节 。 相 应 的 ，8GiB 的 主 存 可 以 存储 8 x 2° 个 字 
节 ， 即 8x1 073 741 824 个 字 节 ， 或 8.59 x 10? 个 字 节 。 撰 写本 文 的 时 候 ， 二 进 制 前 级 在 计算 
机 行业 中 的 使 用 还 远 不 够 普遍 。 在 二 进 制 前 级 标准 化 之 前 ， 十 进 制 前 缀 既 用 于 十 进 制 数 也 用 
于 二 进 制 数 ， 两 者 并 未 区 分 开 来 。 比 如 ， 在 表示 8GiB 的 主 存 容量 时 ， 一 些 制 造 商 仍然 使 用 的 
是 8GB。 再 比如 ,一 些 计 算 机 工程 师 在 说 到 64KB 存储 单元 的 时 候 ， 其 实 指 的 是 64KiB。 
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10 = 1000 





cti 


2" = 1024 





K 
10° = 1000° mega- M 2°= 10247 
10° = 1000° giga- G 2” = 10247 
10” = 1000* tera- T 2” = 1024" 
10' = 1000° peta- P 2 = 1024 


a) 十 进 制 和 二 进 制 前 级 





10°= 1 000 000 2” = 1 048 576 4.9% 
10° = 1 000 000 000 2° = 1 073 741 824 74% 
10’? = 1 000 000 000 000 2" = 1 099 511 627 776 10.0% 
10" = 1 000 000 000 000 000 2° = 1 125 899 906 842 624 12.6% 


b) 十 进 制 数 与 二 进 制 数 之 间 的 误差 
图 1-20 科学 记 数 法 中 的 大 数 前 级 


14.2 时间 量化 


和 空间 一 样 ， 计 算 机 系统 中 所 有 的 计算 还 需要 时 间 。 计 算 机 系统 中 的 时 间 由 两 部 分 组 
成 ， 其 一 是 计算 时 间 ， 即 CPU 执行 其 指令 集中 一 条 指令 所 花费 的 时 间 ; 其 二 是 传输 时 间 ， 
即 信 息 从 系统 的 一 个 组 件 移动 到 另 一 个 组 件 所 花费 的 时 间 。 图 1-20a 中 的 二 进 制 前 级 从 不 用 
于 指定 时 间 。 

以 人 类 的 标准 来 看 ， 一 条 机 器 指令 的 执行 速度 是 很 快 的。 通常 ，CPU 的 速度 用 GHz Æ 
衡量 ， 它 的 含义 是 千 兆赫 兹 ,一 种 频率 单位 。1 赫兹 是 指 每 秒 1 个 时 钟 周期 。 所 以 ，GHz 就 
是 每 秒 十 亿 时 钟 周期 。 例 如 ，4.6 GHz CPU 的 执行 速度 为 每 秒 46 亿 个 时 钟 周 期 。Mc2 层 上 
的 每 条 计算 机 指令 都 需要 一 个 时 钟 周 期 来 执行 。 但 是 ISA3 层 上 的 每 条 指令 都 是 由 Mc2 层 
上 的 若干 条 指令 构成 。 当 你 购买 一 个 应 用 程序 时 ， 你 得 到 的 是 一 个 ISA3 层 的 指令 程序 。 所 
以 ， 当 执行 该 应 用 程序 中 的 一 条 ISA3 层 指 令 时 ， 它 要 执行 几 条 Mc2 层 指令 ， 其 中 的 每 一 条 
都 需要 一 个 时 钟 周期 。 

假设 当前 正在 运行 一 个 应 用 程序 ， 点 击 按钮 执行 一 个 任务 。 下 列 系统 性 能 公式 用 三 项 乘 
积 来 计算 程序 任务 的 总 执行 时 间 : 

.时间 _ 指令 数 、 时 钟 周期 数 HM 
程序 ”程序 指令 时 钟 周期 

第 一 项 是 完成 任务 要 执行 的 ISA3 层 指令 数 ， 第 二 项 是 执行 一 条 ISA3 层 指令 所 需 Mc2 
层 指令 的 平均 数 ， 第 三 项 是 完成 一 个 时 钟 周 期 所 需 的 时 间 ， 它 与 频率 的 关系 是 : 

fet 
/ 

这 里 的 周期 7 是 每 个 时 钟 周期 所 含 的 秒 数 ， 而 CPU 频率 f 是 每 秒 的 时 钟 周期 数 。 在 所 
有 的 科学 计算 中 ， 系 统 性 能 公式 中 的 三 项 单位 相 消 得 到 乘积 的 单位 : 第 一 项 的 分 子 指令 数 与 
第 二 项 的 分 母 指令 相 消 ， 第 二 项 的 分 子 时 钟 周 期 数 与 第 三 项 的 分 母 时 钟 周期 相 消 ， 由 此 得 到 


HIF HEMAH 17 


的 结果 就 是 一 个 程序 消耗 的 时 间 。 

各 条 ISA3 层 指 令 所 占 的 时 钟 周期 数 差异 相当 大 。 有 些 ISA3 层 指令 只 有 一 个 Mec2 周 
期 ， 比 如 两 个 整数 的 加 法 和 减法 指令 ， 或 者 把 一 个 数值 从 CPU 的 一 个 寄存 器 移动 到 另 一 个 
寄存 器 的 指令 。 有 些 则 由 多 个 Mc2 周期 组 成 ， 比 如 ， 两 个 整数 相 乘 需要 四 到 五 个 周期 。 类 
似 双 精度 值 求 余弦 的 复杂 计算 可 能 需要 大 约 100 个 周期 。 给 定 程 序 任务 中 每 条 指令 的 平均 时 
钟 周期 数 依赖 于 完成 该 任务 需要 执行 的 ISA3 指令 组 合 。 

CEE 假设 CPU 的 频率 为 2.5GHz， 在 应 用 程序 上 执行 一 个 程序 任务 ,需要 执行 1600 
万 条 ISA3 指令 。 若 每 条 ISA3 指令 平均 执行 3.7 条 Mc2 指令 ， 则 该 程序 任务 的 执行 时 间 是 
多 少 ? 

时 间 /程序 

=< 系统 性 能 公式 > 

(指令 数 /程序 ) X (时 钟 周期 数 / 指令) X (时 间 /时钟 周期 ) 
=< Fl 7=1/f 替换 第 三 项 > 
(16X10°) x (3.7) x (1/(2.5x10°)) 

=< 计 算 > 

求 得 时 间 为 23.7x107 秒 ， 即 大 约 0.024 秒 。 6 

此 例 展示 了 如 何 计算 执行 程序 任务 花费 的 时 间 。 计 算 机 系统 中 与 时 间 有 关 的 另 一 个 方面 
是 信息 从 系统 的 一 个 组 件 移 动 到 另 一 个 组 件 需要 的 时 间 。 通 常 ， 信 息 流 的 源 和 目的 之 间 的 连 
接 被 称 为 通道 (channel)。 通 道 可 以 是 计算 机 系统 内 构成 系统 总 线 的 电线 ， 也 可 以 是 基站 与 
手机 之 间 的 空间 。 通 道 的 带宽 是 每 单位 时 间 可 以 携带 的 信息 量 。 高 带宽 的 通道 每 秒 传输 的 信 
息 量 多 于 低 带 宽 的 通道 。 通 道 带宽 一 般 用 每 秒 位 数 (b/s) 作 单 位 ， 不 过 偶尔 也 会 用 每 秒 字 节 
数 (B/s) 作 单位 。 一 个 字 节 有 8 位 ， 所 以 ， 假 如 通道 带宽 为 8.2MB/s， 那 么 就 等 于 8 x 8.2 即 
65.6Mb/s.. 

下 面 的 带宽 公式 用 两 项 的 乘积 来 计算 传输 的 总 信息 量 : 

A 信息 量 
222 = 时 间 x 时 间 

乘积 的 第 一 项 是 通道 带宽 ， 第 二 项 是 传输 时 间 。 

GED 计算 机 系统 中 硬盘 与 主 存 之 间 的 DMA 通道 带宽 为 3Gb/s， 若 利用 硬盘 到 主 存 
的 DMA 传输 从 计算 机 的 照片 库 中 传送 400MB 缩 略图 数据 库 ， 所 需 时 间 是 多 少 ? 

时 间 
=< 用 带宽 公式 来 求 时 间 > 

a / (信息 / 时 间 ) 
=< 按 每 字 节 8 位 代入 信息 值 > 

8 X 500 X 10°/3 x 10° 
=< 计算 > 

1.33s m 

一 打字 员 从 计算 机 键盘 上 输入 一 些 文本 ， 打 字 速 度 为 每 分 钟 35 个 字 。 要 满 
足 打 字 员 与 计算 机 系统 之 间 的 信息 流 需 要 多 大 的 通道 带宽 ?假设 平均 一 个 字 后 面 加 一 个 空 
格 符 。 

算 上 每 个 单词 后 面 的 空格 符 ， 打 字 员 每 分 钟 输入 36 个 字符 。 
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带宽 

=< 带宽 定义 > 

信息 量 / 时 间 

三 < 代入 数值 > 

(8 (b/ 字符 ) X36 个 字符 ) / (1 (分 钟 ) X60 ( 秒 / 分 钟 )) 

=< 计 算 > 

4.8b/s a 


1.4.3 ”快速 响应 码 


快速 响应 码 (QR 码 ) 由 日 本 发 明 ， 用 于 跟踪 汽车 行业 的 商品 。 但 是 ，QR 码 的 应 用 范围 
非常 广泛 ， 现 在 它 用 于 存储 各 种 类 型 的 
文本 信息 ， 这 些 信息 通过 带 内 置 摄像 头 
的 移动 设备 扫描 即 可 轻松 获得 。 图 1-21 
展示 了 两 个 QR 码 。 图 1-21a 是 网 络 
URL # QRH, Bl 1-21b 是 本 章 第 一 段 





ein ) 一 个 网 络 URL 的 R 码 D 本 说 第 一 让 文本 的 OR 
QR 码 是 由 各 种 颜色 的 浅 色 和 深 色 ° 机 Q 
方块 构成 的 方 阵 ， 每 一 个 方块 都 存储 图 1-21 两 个 QR 码 


了 一 位 信息 。QR 码 中 的 一 个 方块 称 为 
模块 。 下 面 的 讨论 将 把 一 个 模块 当 作 一 位 ， 如 果 它 是 黑色 的 ， 表示 存储 的 是 1， 如 果 是 白色 
的 ， 表 示 存 储 的 是 0。QR 码 有 40 个 版 本 ，21 x21 位 是 版 本 1，25 x25 位 是 版 本 2,， 一 直 
到 177 x 177 位 是 版 本 40。 每 一 版 本 都 是 在 前 一 个 版 本 的 每 个 维度 上 增加 4 位 。 图 1-21a 是 
29x29 位 的 版 本 3， 图 1-2lb 是 81x8l 位 的 版 本 11。 版 本 号 越 大 ， 存 储 的 信息 越 多 。 图 
1-21b 表示 的 编码 存储 了 本 章 第 一 段 的 全 部 564 个 字符 。 

网 格 中 用 于 校准 和 格式 的 七 个 保留 部 分 如 下 : 

e 探测 图 形 

e 分 隔 符 

o 深 色 模块 

e 格式 信息 区 

e 定位 图 形 

e 校准 图 形 (版 本 2 或 更 高 版 本 ) 

e 版 本 信息 区 (版 本 7 或 更 高 版 本 ) 

图 1-22a 展示 的 是 图 1-21aQR 码 版 本 3 的 前 六 个 域 ， 该 版 本 没有 保留 版 本 信息 区 。 

探测 图 形 是 7 x7 的 方块 ， 位 于 编码 的 三 个 角 上 ， 帮 助 扫描 仪 确定 编码 的 方向 。 每 个 图 
pas : 层 组 成 ， 最 内 层 为 一 个 3x3 黑色 方块 ， 外 面 套 一 个 $ 位 宽 的 白色 边框 ， 最 外 层 则 

一 个 7 位 宽 的 黑色 边框 。 整 个 探测 图 形 占据 的 位 数 为 7x7x3， 即 147 位 。 分 隔 符 是 围绕 
AMA AAO, -TARNE =A seas, PRUE FR 
WU PELE > Ba FF A a A — 7S 0. SP A SB Be? AB Od ek HA A IX, — FE 30 位 。 
这 四 个 保留 域 在 编码 中 的 位 置 总 是 不 变 的 ， 占 据 的 总 位 数 为 147+45+1+30， 即 223 位 。 

定位 图 形 帮 助 扫描 仪 识别 网 格 中 各 个 行 和 列 。 每 个 定位 图 形 都 是 一 条 交替 出 现 的 1 和 
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0， 所 占 位 数 则 依赖 于 编码 的 版 本 。 版 本 越 高 ， 定 位 图 形 的 位 数 越 多 。 版 本 3 是 29 x 29 位 的 
网 格 ，29 位 减 去 每 端 被 探测 图 形 和 分 隔 符 占据 的 8 位 ， 得 到 每 个 定位 图 形 有 13 位 ， 两 个 图 
形 就 是 26 位 。 


分 隔 符 
定位 图 形 





校准 图 形 
版 本 信息 区 一 > 





深 色 模 块 


a) 图 1-21a 所 示 QR 码 版 本 3 的 保留 域 b) 版 本 7 编码 的 保留 域 
图 1-22 QR 码 中 的 保留 域 
每 个 校准 图 形 都 是 一 个 5x5 的 方块 ， 因 此 占据 25 位。 但 是 ,不 同 版 本 的 校准 图 形 个 数 
会 有 不 同 ， 并 且 在 位 置 上 可 能 会 与 定位 图 形 相交 。 图 1-22a 的 版 本 3 只 有 一 个 校准 图 形 ， 且 
不 与 定位 图 形 相交 。 而 在 图 1-21b 的 QR 码 中 你 能 找到 13 个 校准 图 形 ， 其 中 两 个 与 顶端 定 [29] 
位 图 形 相交 ， 两 个 与 左 侧 定位 图 形 相 交 。 要 计算 可 用 于 存储 信息 的 位 数 ， 只 需 从 网 格 的 总 位 
数 中 减 去 保留 位 数 即 可 。 对 图 1-22a 的 版 本 3 来 说 ， 就 是 29 x 29 (或 841 ) 减 去 前 四 个 保留 
域 的 223 位 、 定 位 图 形 的 26 位 以 及 校准 图 形 的 25 位 之 后 得 到 的 567 位 。 
版 本 信息 区 只 出 现在 版 本 7 和 更 高 版 本 中 。 如 果 有 这 个 域 ， 它 会 占据 与 右上 角 和 左下 
角 探 测 图 形 相 连 的 两 个 3 x6 方 块 。 图 1-22b 是 版 本 7 的 4$ x 45 网 格 ， 其 中 有 两 个 版 本 信息 
区 ， 每 一 个 都 占 了 18 位 。 这 个 版 本 还 有 6 个 校准 图 形 ， 其 中 的 两 个 与 定位 图 形 相交 。 在 25 
位 中 每 个 相交 的 校准 图 形 只 占 20 位 ， 因 为 中 间 的 行 或 列 已 经 被 定位 图 形 占用 了 。 定 位 图 形 
中 交替 的 0-1 模式 并 不 受 与 之 相交 的 校准 图 形 的 影响 。 
CEO 在 图 1-22a 版 本 7 的 QR 码 中 用 于 存储 信息 的 有 多 少 位 ? 
用 于 信息 的 位 数 
=< 总 数 减 去 保留 位 > 
45 X45—fixed—timing—align—interalign—vinfo 
=< 代 入 数值 > 
45X45-223-2(45-2X8)-4X25-2X20-2X18 
=<it# > 
1496 b 
FOR, fixed 是 前 四 个 保留 域 的 位 数 ; timing 是 两 个 定位 图 形 的 位 数 ; align 是 四 个 不 
与 定位 图 形 相交 的 校准 图 形 的 位 数 ; interalign 是 两 个 与 定位 图 形 相 交 的 校准 图 形 的 位 数 ; 
vinfo 是 两 个 版 本 信息 区 的 位 数 。 a 
QR 码 中 有 四 种 信息 位 : 
。 模式 指示 器 
字符 计数 指示 器 
o 纠 错 宛 余 位 
e 数据 位 
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模式 指示 器 是 一 个 四 位 的 字符 串 ， 用 于 指明 QR 码 表示 的 是 哪 种 字符 。 数 字模 式 用 于 只 


BO) 存储 数字 的 编码 ; 混合 模式 存储 的 序列 包含 大 写 英 文字 母 、10 个 十 进 制 数字 和 一 些 标点 符号 ; 


[31] 


字 节 模式 存储 ASCI 字符 序列 。 其 他 还 有 两 种 模式 ， 其 中 之 一 存储 的 是 亚洲 语言 里 的 日 文 
汉字 字符 。 

字符 计数 指示 器 的 长 度 从 8 位 到 16 位 不 等 ， 其 位 数 取决 于 QR 码 的 版 本 和 模式 。 比 如 ， 
版 本 10 使 用 数字 模式 ， 字 符 计 数 器 长 度 为 12 位 ， 而 版 本 27 的 字符 计数 器 长 度 则 为 14 位 。 
不 论 字 符 计 数 器 指示 器 有 多 少 位 ， 它 表示 的 都 是 能 存储 的 字符 数 。 图 1-21a 中 的 QR 码 版 本 
3 用 字 节 模式 存储 URL 地 址 的 43 个 ASCII 字 符 ， 其 字符 计数 器 包含 8 位 为 0010 1011， 即 
二 进 制 形式 的 整数 43 。 

无 论 什么 时 候 存 储 和 传输 信息 ， 都 会 出 现 错误 。 比 如 ， 当 你 在 房间 里 移动 移动 设备 时 ， 
无 线 信 号 可 能 会 失真 。 或者，QR 码 上 有 一 点 污渍 遮盖 了 编码 的 图 案 ， 当 该 位 本 应 为 0 时， 
扫描 仪 可 能 会 将 白色 位 上 的 污渍 读 为 1。 处理 这 种 错误 的 常用 技术 是 给 数据 添加 额外 的 位 ， 
使 得 接收 器 能 检测 错误 是 否 发 生 ， 如 果 发 生 就 改正 它 。9.4 节 介绍 了 错误 检测 和 纠正 编码 的 
工作 原理 。QR 码 使 用 的 错误 纠正 技术 与 蓝光 光盘 表面 有 划 痕 并 导致 读 取 错 误 时 采用 的 技术 
是 一 样 的 。 

图 1-23 给 出 了 QR 码 的 四 种 可 能 的 纠 错 级 别 。 最 
低 纠 错 级 工 能 在 7% 的 编码 被 损坏 的 情况 下 恢复 QR 码 aaa Tee 


中 全 部 的 文本 。 比 它 高 一 级 的 是 M 级 ， 能 在 15% 的 编 L 7% 被 损坏 
码 被 损坏 时 恢复 全 部 的 文本 。 最 高 纠 错 级 日 能 应 对 纺 M 15% 被 损坏 
码 被 损坏 30% 的 情况 。 纠 错 级 越 高 ， 需 要 的 宛 余 位 越 Q 25% 被 损坏 

H 30% 被 损坏 


多 ,那么 对 给 定 的 QR 码 版 本 来 说 ， 能 用 于 存储 数据 的 
位 就 越 少 。 在 实际 应 用 中 , 工 级 和 M 级 最 常见 。 对 编 图 1-23 QR 码 中 四 种 纠 错 级 别 
码 信息 来 说 ， 表 示 模 式 和 字符 计数 指示 器 的 位 ， 以 及 用 
于 纠 错 的 宛 余 位 都 是 开销 ， 在 确定 QR 码 存储 信息 的 数 
据 位 数 时 ， 必 须 将 它们 从 信息 位 中 除开 。 在 存储 ASCI 码 消息 的 字 节 模式 中 , LRA M 级 
的 开销 分 别 约 为 20% 和 40%。 
TE QR 码 29x 29 的 版 本 3 中 能 存储 多 少 个 ASCI[ 字 符 ? 已 知 该 版 本 中 有 一 个 
校准 图 形 ， 且 不 与 定位 图 形 相交 ， 使 用 工 级 纠 错 ， 开 销 为 25%。 
首先 ， 计 算 信 息 位 数 : 
可 用 信息 位 数 
=< 总 数 减 去 保留 位 > 
29 X 29—fixed—timing—align 
=< 代 入 数值 > 
29 X 29—223-2(29-2 X 8)-25 
=< > 
567b 
如 果 模 式 和 字符 计数 指示 器 位 数 加 上 纠 错 元 余 位 数 构 成 了 25% 的 开销 ， 那 么 100%- 
25%=75% 的 信息 位 可 用 于 数据 位 。 
最 大 字符 数 
=< 计 算 开 销 > 
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(数据 比例 ) x (字符 数 ) 
=< 代 入 数值 > 
(1.00—0.25) x (567 b/8(b/char)) 
=<it# > 
53.16 
=< 四 舍 五 入 > 
53 个 字符 
图 1-21a 所 示 QR 码 的 URL 为 版 本 3， 使 用 的 是 工 级 纠 错 。 它 有 49 个 字符 ， 只 比 字符 
数 上 限 53 少 一 点 。 m 


1.4.4 图 像 


计算 机 系统 中 的 图 像 包 括 计算 机 屏幕 上 的 图 像 、 纸 质 文档 上 的 扫描 图 像 和 照相 机 捕捉 到 
的 照片 图 像 。 根 据 设备 的 不 同 ， 图像 可 以 是 黑白 的 、 灰 度 的 和 彩色 的 。 而 与 设备 无 关 的 是 ， 
所 有 的 图 像 在 计算 机 系统 中 都 以 二 进 制 形式 存储 。 

图 1-24 显示 了 字母 了 在 四 种 不 同 设 备 上 的 渲染 。 图 a 中 ,字母 图 像 占用 了 5 x 8 像素 的 
ERKE, Alb 中 占用 了 11 x 16 像素 的 区 域 。 从 这 两 个 图 中 可 以 看 出 来 ， 存 储 图 像 所 用 的 
像素 越 多 ， 图 像 越 精确 。 提 高 图 像 精确 度 的 方法 之 一 是 增加 每 英寸 像素 的 数量 ， 直 到 人 有 眼 无 
法 感知 到 单个 像素 。 另 一 种 提高 精确 度 的 方法 是 设计 每 个 像素 都 能 显示 灰 度 ， 而 不 仅仅 只 是 
黑白 两 色 。 在 图 中， 字母 图 像 的 像素 数量 接近 图 a， 但 其 中 一 些 像 素 显示 了 介 于 纯 黑 和 纯 
白 之 间 的 各 种 灰 度 。 同 样 ， 图 d 中 图 像 的 像素 数量 几乎 与 图 b 相等 ， 但 其 显示 的 灰 度 使 得 它 
更 精确 ， 尤 其 是 从 远 处 看 的 时 候 。 


PFPPP 


a) 黑白 , 5x8 b) A, 11x16 c) RE, 6x9 d) RË, 11x17 
图 1-24 字母 P 的 黑白 和 灰 Eee 


黑白 激光 打印 机 具有 同样 的 工作 原理 ， 它 在 纸张 每 个 像素 的 位 置 上 打出 或 不 打出 一 个 黑 
色 的 墨 点 。 由 于 没有 灰色 墨 粉 ， 因 此 产品 设计 师 就 通过 增加 每 英寸 点 数 来 提高 精确 度 。 一 台 
典型 的 桌面 激光 打印 机 每 英寸 有 600 或 1200 像素 ， 而 商用 排版 机 器 每 英寸 有 2400 像素 或 者 
更 多 。 为 了 打印 出 灰 度 ， 打 印 机 在 白色 中 夹杂 黑 点 来 沉积 出 图 像 ， 因 此 ， 从 远 处 看 ， 人 眼 观 
察 到 的 就 是 灰色 。 文 件 扫 描 仪 通常 可 以 选择 黑白 扫描 、 灰 度 扫描 或 彩色 扫描 。 当 你 在 屏幕 上 
查看 一 个 扫描 的 灰 度 图 像 时 ， 每 个 屏幕 像素 都 可 以 显示 独立 的 灰 度 。 

与 计算 机 系统 中 的 所 有 信息 一 样 ， 图 像 也 是 以 二 进 制 形 式 存 储 的 。 图 1-25a 显示 了 
图 1-24a 中 黑白 图 像 的 二 进 制 存 储 。 其 存储 网 格 中 的 每 个 单元 都 是 一 个 单独 的 位 ， 若 相应 的 
像素 是 黑色 的 ， 其 值 为 1， 若 为 白色 ， 则 其 值 为 0。 存储 图 像 所 需 总 位 数 即 为 存储 网 格 总 的 
单元 数 。5 x 8 的 网 格 需要 40 位 来 存储 图 像 ， 即 5 个 字 节 。 

存储 图 像 的 位 深 (bit depth) 是 指 存储 一 个 像素 所 需 的 位 数 。 图 1-25a 中 ， 由 于 每 个 像 
素 一 位 ， 所 以 位 深 为 1。 图 1-25b 显示 的 是 图 1-24c 灰 度 图 像 的 二 进 制 存 储 ， 该 图 像 的 位 深 
为 3， 因 为 存储 每 个 像素 用 了 三 位 。 图 1-18 的 表格 列 出 了 一 个 三 位 存储 单元 的 全 部 八 种 取 
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fH. 图 1-25b 图 像 中 的 每 一 个 像素 都 是 这 八 种 可 能 灰 度 值 中 的 一 个 。 比 如 ， 左 下角 像素 是 黑 
色 的 ， 其 二 进 制 取 值 为 111 ; 右 下 角 像 素 是 白色 的 ， 其 二 进 制 取 值 为 000。 最 下 一 行 左 起 第 
二 个 像素 的 二 进 制 值 为 010， 显 示 为 浅 灰 色 ; 其 上 面 的 像素 颜色 略 深 ， 二 进 制 值 为 101。 显 
示 一 个 灰 度 图 像 所 需 的 总 位 数 等 于 像素 数量 乘 以 位 深 。 


四 四 四 四 区 加 


penn eee 
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a) 存储 图 1-24a 的 图 像 b) 存储 图 1-24c 的 图 像 
图 1-25 黑白 图 像 与 灰 度 图 像 的 二 进 制 存储 





eReader 的 灰 度 显示 器 为 1072 x 1448 像素 ， 每 个 像素 可 以 显示 16 种 灰 度 。 该 
设备 的 显示 存储 器 大 小 为 多 少 KiB ? 
首先 确定 显示 位 深 。 由 于 每 个 像素 能 显示 16 种 灰 度 ， 而 2=16， 因 此 位 深 为 4。 然 后 计 
算 显 示 存 储 器 的 大 小 : 
显示 存储 器 的 大 小 
=< 乘法 > 
(像素 个 数 ) X (AR) 
=< 代入 数值 > 
(1072 X 1448 像素 ) X4 (b/ 像素 ) 
三 过 计算 > 
6 209 024b 
=< 转 换 为 KiB> 
(6 209 024b) x (1B/8b) x (1KiB/1024B) 
=< 计 算 > 
758 KiB = 
在 彩色 显示 中 ， 屏 幕 上 的 每 个 像素 发 出 一 种 颜色 ， 人 有 眼 捕获 来 自 像素 场 的 光线 并 将 其 聚 
焦 在 视网膜 上 。 视 网 膜 含 有 对 光敏 感 的 两 种 感光 细胞 ， 它 具有 约 600 万 个 对 颜色 敏感 的 锥 形 
细胞 ， 以 及 1.2 亿 个 对 颜色 不 敏感 的 棒状 细胞 ， 能 在 微 光 条 件 下 形成 视觉 。 这 些 细胞 把 光 能 
转换 为 电信 号 ， 通 过 视觉 神经 传递 给 大 脑 。 大 脑 将 来 自 感光 细胞 的 所 有 信号 组 合 起 来 ， 在 头 
脑 中 形成 图 像 。 严 格 说 来 ,光线 是 没有 颜色 的 ， 颜色 只 存在 于 人 类 的 脑海 中 。 当 你 在 彩色 显 
示 器 上 看 一 幅 逼 真 的 景象 时 ， 像 素 发 出 的 光 点 被 感光 细胞 检测 到 ， 并 经 过 大 脑 处 理 形成 结果 
图 像 ， 这 个 图 像 与 你 在 自然 环境 中 看 到 并 由 大 脑 构建 的 图 像 非常 接近 。 
在 人 类 看 来 太阳 光 是 白色 的 , 但 它 其 实 是 一 系列 颜色 的 混合 体 。 雨 天 当 太 阳 出 来 的 时 
候 ， 空 气 中 的 每 一 个 水 滴 都 是 一 个 微型 棱镜 ， 它 把 混合 在 一 起 的 颜色 分 解 为 可 见 光谱 并 形成 
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彩虹 。 光 谱 中 的 每 一 种 颜色 都 是 一 种 纯色 ， 其 光线 具有 单一 波长 。 图 1-26 展示 了 可 见 光谱 
中 光线 的 波长 ， 其 范围 从 紫色 的 400nm (纳米 ) 
到 红色 的 700nm。 该 光谱 之 外 的 颜色 由 纯色 混合 


而 成 。 比 如 ， 如 果 光 线 由 纯 红色 和 纯 蓝 色 混 合 ， | 
大 脑 就 会 解释 锥 形 细胞 的 信号 ， 从 而 在 脑海 里 形 ga see ah: 
成 紫色 。 绿色 495 ~ 570 nm 

视网膜 具有 三 种 锥 细胞 ， 分 别 对 可 见 光谱 中 ers 5 Sena 
短 、 中 、 长 波长 的 光敏 感 。 图 1-27 给 出 了 每 种 pE 590 ~ 620 nm 
锥 形 细 胞 敏感 的 波长 范围 。 第 一 种 是 S-cone (Hi 红色 620 ~ 700 nm 


波长 视 锥 细胞 )， 它 的 敏感 波长 范围 为 400nm 到 
540nm，430nm 左右 是 其 敏感 峰值 ， 相 应 的 颜色 
为 蓝 紫 色 。 第 二 种 是 M-cone (中 波长 视 锥 细胞 )， S M L 

它 的 敏感 峰值 大 约 在 S40nm， 对 应 颜色 近似 绿 

色 。 第 三 种 是 L-cone (长 波长 视 锥 细胞 )， 其 敏 

感 波长 范围 更 大 ， 与 前 两 种 视 锥 细胞 相 比 ， 它 对 

红色 更 敏感 。 400 500 600 700 

从 图 1-27 可 以 看 出 ， 如 果 光 源 向 人 眼 发 图 127 视 锥 细胞 敏感 度 与 波长 的 函数 关系 
出 的 是 单纯 580nm 的 光线 ， 那 么 M-cone 和 
L-cone 都 会 检测 到 光线 ， 并 向 大 脑 发 出 信号 
大 脑 把 这 两 种 信号 组 合 起 来 ， 在 脑海 里 形成 黄色 。 两 种 不 同 的 光线 形成 相同 的 颜色 也 是 可 能 
的 ， 比 如 ， 混 合 了 纯 红色 和 纯 绿 色 的 光线 也 能 同样 激活 M-cone 和 L-cone， 它 们 的 组 合 信和 号 
与 纯 580nm 光线 发 出 的 信号 相同 。 在 这 种 情况 下 ， 大 脑 会 再 次 感知 到 黄色 。 

与 灰 度 显示 类 似 ， 彩 色 显 示 也 是 由 像素 网 格 构成 的 ,不 同 的 是 ， 其 中 的 每 个 像素 都 有 
三 个 子 像素 : 一 个 发 红 光 ， 一 个 发 绿 光 ， 还 有 一 个 发 蓝光 。 图 1-28a 展示 了 一 个 彩色 像素 ， 
R 代表 红色 子 像素 ，G 代表 绿色 子 像素 ，B 代表 蓝 色 子 像素 。 这 种 被 称 为 RGB FAN TR 
素 布 局 是 最 常见 的 ， 而 有 些 设 备 也 有 不 同 的 子 像素 排列 。 显 示 器 是 方形 像素 的 二 维 网 格 。 
图 1-28b 展示 了 彩色 显示 器 16 x 8 的 范围 ， 其 中 的 每 一 个 像素 都 有 三 个 子 像素 。 从 远 处 看 ， 
人 眼 无 法 分 辨 单个 子 像素 。 视 锥 细胞 从 一 个 像素 接收 光线 ， 就 好 像 它 是 一 个 单独 的 光源 ， 而 
其 颜色 则 由 红 绿 蓝 三 种 分 量 的 组 合 来 决定 。 


图 1-26 可 见 光谱 中 的 颜色 
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a) 一 个 彩色 像素 含有 三 个 子 像素 b) 16x8 像素 的 彩色 显示 


图 1-28 彩色 像素 


当 我 们 在 自然 条 件 下 观察 环境 时 ， 眼 睛 并 不 是 仅仅 接收 红 绿 蓝 三 色 的 混合 光线 ， 而 是 可 
见 光 谱 所 有 波长 的 混合 光线 。 但 是 ， 当 我 们 看 计算 机 显示 器 上 的 场景 时 ， 眼 睛 接收 到 的 只 
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有 来 自 红 绿 蓝 三 种 子 像素 的 混合 光线 。 显 示 器 上 的 场景 显得 真实 ， 是 因为 每 个 像素 的 红 绿 蓝 
三 色 组 合 在 我 们 的 大 脑 中 产生 了 对 颜色 的 感知 ， 它 与 真实 世界 中 不 同 波长 的 混合 光线 所 产生 
的 感知 非常 相近 。 不 过 ， 单 单 依靠 三 种 子 像 素来 产生 自然 界 中 人 眼 可 见 的 所 有 颜色 是 不 可 能 
的 。 人 有 眼 在 显示 器 上 能 看 见 的 颜色 只 能 是 由 来 自 红 绿 蓝 三 种 子 像素 的 混合 颜色 在 大 脑 中 生 
成 的 。 

就 灰 度 图 像 而 言 ， 存 储 一 个 彩色 图 像 所 需 的 位 数 等 于 显示 器 上 像素 的 个 数 乘 以 每 个 像 
素 的 位 深 。 图 1-25b 中 ， 因 为 每 个 位 能 显示 八 种 灰 度 ， 所 以 该 灰 度 图 像 是 位 深 为 3。 而 在 
图 1-28b 中 ， 每 个 彩色 像素 都 含有 三 个 子 像素 。 如 果 每 个 子 像素 都 能 显示 其 颜色 的 八 种 灰 
度 ， 那 么 每 个 像素 的 位 数 3 还 要 再 乘 以 3， 也 就 是 等 于 9。 彩色 像素 的 总 位 数 有 时 也 被 称 为 
ER (color depth， 色 彩 深度 )。 在 彩色 显示 中 ， 每 个 子 像素 通常 会 有 256 级 亮度 ， 由 于 256 
等 于 2*， 因 此 红 绿 蓝 三 种 子 像 素 分 别 都 需要 8 位 进行 显示 ， 其 总 位 深 为 24。 图 1-29 给 出 了 
一 个 像素 可 能 显示 的 一 些 颜色 。 该 表 以 十 进 制 的 形式 给 出 了 亮度 级 ,但 和 计算 机 系统 中 的 所 
有 信息 一 样 ， 实 际 存储 时 也 是 以 位 为 单位 的 。 亮 度 255 用 八 位 存储 时 ， 其 二 进 制 值 为 1111 
1111 ; 亮度 192 的 存储 值 为 1100 0000 ; 亮度 128 的 存储 值 为 1000 0000。 第 3 章 将 说 明 十 

[36] 进 制 与 二 进 制 之 间 的 换算 关系 。 


人 
白色 255 255 255 
银色 192 192 192 
灰色 128 128 128 
黑色 0 0 0 
红色 255 0 0 
褐 红色 128 0 0 
黄色 255 255 0 
WARE 128 128 0 
绿 黄色 0 255 0 
绿色 0 128 0 
湖绿 色 0 255 255 
蓝 绿 色 0 128 128 
蓝 色 0 0 255 
深蓝 色 0 0 128 
紫红 色 255 0 255 
紫色 128 0 128 


图 1-29 ”位 深 为 24 的 彩色 像素 可 能 显示 的 部 分 颜色 


GERD GPS 系统 的 屏幕 大 小 为 4.5 英寸 x 2.5 英寸 ,每 英寸 有 120 个 彩色 像素 。 
已 知 每 个 子 像素 能 显示 64 级 亮度 ， 问 该 显示 存储 器 的 容量 为 多 少 KiB ? 
首先 ， 确 定 显示 器 中 像素 的 总 数 。 
像素 总 数 
=< 乘 法 > 
(宽度 ) x (高 度 ) 
=< 代 入 数值 > 
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(4.5 英寸 x120 个 像素 /英寸 ) x (2.5 英寸 x120 个 像素 /英寸 ) 
=<it#> 
162 000 个 像素 

因为 每 个 子 像 素 能 显示 64 级 亮度 ， 而 2 所 64， 所 以 ， 每 个 子 像素 的 位 数 为 6。 同 时， 每 
个 像素 有 3 个 子 像素 ,由 此 ， 位 深 =3 x6， 即 18。 显 示 存 储 器 容量 计算 如 下 : 

显示 存储 器 容量 
= 二 乘法 > 

(像素 个 数 ) X (RMR) 
=< 代 入 数值 > 

(162 000 个 像素 ) x18 (位 /像素 ) 
=<< 计 算 > 

2916 000 b 
=< 转换 为 KiB> 

(2 916 000b) x (1B/8b) x (1KiB/1024B) 
=<it#> 

356 KiB = 

彩色 显示 器 不 能 产生 所 有 的 自然 色彩 ， 只 能 产生 它们 的 近似 颜色 ， 这 种 做 法 在 计算 机 系 
统 的 各 个 方面 都 非常 常见 。 计 算 机 的 作用 在 于 执行 来 自 真实 世界 的 任务 ,方法 就 是 对 真实 志 
界 的 各 个 方面 进行 建 模 。 但 是 这 种 真实 世界 的 计算 机 模型 总 是 处 于 近似 的 状态 

举 个 例子 ， 一 个 位 深 24 的 彩色 显示 器 ， 它 的 每 个 像素 都 能 产生 2", E 16777 216 种 不 
同 的 颜色 。 人 有 眼 能 分 辩 的 颜色 约 为 10 000 000 种 ， 因 此 ， 看 起 来 就 是 彩色 显示 器 可 以 产生 人 
眼 能 看 见 的 全 部 颜色 。 但 其 实 这 是 不 可 能 的 ， 原 因 有 两 个 。 第 一 ， 当 一 个 子 像素 只 有 一 个 亮 
度 级 别 的 差异 时 ， 人 有 眼 是 无 法 区 分 这 两 个 像素 颜色 的 。 这 样 一 来 ，16 777 216 种 颜色 中 可 区 
分 的 颜色 数量 就 小 于 人 有 眼 能 分 辨 的 10 000 000 种 颜色 。 第 二 ,产生 全 部 人 眼 能 分 辩 颜 色 的 唯 
一 方法 就 是 每 个 像素 要 有 三 个 以 上 的 子 像素 ， 并 且 它 们 的 波长 要 包含 整个 可 见 光谱 。 

再 举 个 例子 ， 整 数 的 一 个 数学 特性 是 没有 最 大 值 。 那 么 ， 整 数值 的 个 数 就 应 该 是 无 限 
个 。 但是， 所 有 的 计算 机 都 是 有 限 的 。 如 果 用 位 的 存储 单元 来 存储 一 个 整数 ， 那 么 只 能 
存储 2 个 数值 ， 而 不 是 无 限 个 数值 。 对 给 定 的 存储 单元 来 说 ， 最 大 整数 值 是 存在 的 。 因 此 ， 
计算 机 中 存储 的 整数 的 特性 并 不 完全 等 同 于 数学 整数 的 特性 。 








清楚 。 因 此 ， are TTTS ETTET 
相当 多 的 细节 信息 。 本 节 描 述 了 每 一 层 。” 计 销售 了 许多 不 同 的 计算 机 系统 。 然 而 
的 简化 模型 ， 以 此 说 明 该 层 操作 的 基本 。 随 着 时 代 的 发 展 ， 不 同 计算 机 系统 的 数 
原理 。 这 些 原理 适用 于 所 有 的 真实 计算 量 逐 渐 减 少 ， 时 至 今日 ， 只 有 两 个 计算 
机 系统 ， 但 模型 本 身 只 是 近似 于 真实 系 机 系统 主导 了 商业 市 场 一 InteI/AMD 系 








应 用 居 (F 7 &) 


统 和 ARM 系统 。Intel 和 Advanced Micro 
是 台式 机 和 和 笔记 本 电脑 


Devices ( AMD) 
常见 的 x86 系列 计算 机 系统 的 制造 商 。 而 
像 智 能 手机 和 平板 电脑 这 样 的 移动 设备 ， 
则 被 Advanced RISC Machines (ARM) 系 
统 占 据 了 市 场 。 首 字母 缩写 ARM PWR 
KABERI, 代表 的 是 精简 指令 集 计 
算 机 (Reduced Instruction Set Computer, 
RISC). 


与 之 对 应 的 ，x86 系列 使 用 的 是 
复杂 指令 集 计算 机 (Complex Instruction — 
Set Computer, CISC) 设计 。 本 书 第 12 
章 将 介绍 CISC 和 RISC 设计 的 差异 。 


Intel Core i7 系统 是 一 组 集成 电路 ， 
也 被 称 为 计算 机 芯片 组 ， 它 构 成 了 许多 
Microsoft Windows 和 Apple OSX € x 
机 与 笔记 本 电脑 的 基础 。 图 1-30 展示 了 
Core i7 系统 的 一 些 细节 ， 它们 没有 出 现 


在 相应 的 图 1-9 中 。 虚线 框 表示 的 是 电路 


板 上 一 个 约 两 英寸 见方 的 物理 封装 。 这 
个 封装 包 里 面 的 集成 电路 与 其 底部 的 引 
脚 格 概 相 连 ， 然后 电 接 触 到 电路 板 的 表 
面 。 平台 控制 单元 (PCH) 是 安装 在 电路 
板 上 的 另 一 个 组 成 部 分 。 
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图 1-30 Intel Core i 系统 


当前 系统 与 图 1-9 的 简化 模型 最 明 
显 的 差异 是 多 个 CPU 的 存在 。 单 芯片 通 


常 包含 多 个 被 称 为 内 核 的 中 央 处 理 单元 ， 
它们 能 并 行 执行 。 多 个 CPU 同时 执行 能 


加 速 计 算 ， 就 好 比 在 一 个 任务 上 同时 有 


多 个 人 在 工作 ， 从 而 缩短 任务 完成 的 时 
Ha Core i7 包括 一 系列 型 号 ， 按 照 型 号 


不 同 ， 其 内 核 数量 从 四 个 (如 图 1-30 所 


示 ) 到 八 个 不 等 。 


图 1-9 中 所 有 和 外围 设备 和 主 存储 器 共 
享 一 个 主 系统 总 线 ， 这 是 早期 个 人 计算 
机 系统 的 特征 。 图 1-30 中 标注 为 直接 媒 
体 接口 (DMI) 的 箭头 对 应 于 图 1- 9 的 系 
统 总 线 。 所 有 的 外 围 设 备 都 共享 该 总 线 ， 
比如 磁 盘 驱动 器 和 连接 到 因特网 的 以 太 
网 卡 ， 该 总 线 又 与 相 邻 封装 包 中 的 CPU 


相连 。PCH 控制 DMI 总线 上 的 通信 ， 它 
在 设备 之 间 切 换 ， 并 调度 总 线 通 信 。 与 
图 1-9 相 比 ， 主 存 模块 没有 共享 DMI A 
统 总 线 ， 而 是 通过 被 称 为 通道 的 独立 路 
径 与 CPU 相连 。 四 个 主 存 通道 分 别 标识 
为 ChA、ChB、ChC 和 ChD。Core i7 # 
装 包 内 的 集成 内 存 控制 器 OMC) 能 在 
主 存 模块 和 CPU HETER, k 
外 ， 每 个 CPU 无 法 区 分 各 个 主 存 模块 。 
IMC 使 得 所 有 主 存 模 块 在 每 个 CPU 
表现 得 像 单一 主 存 一 样 。 
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1.5 数据 库 系 统 
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常用 于 把 外 部 磁盘 驱动 器 连接 到 电路 
板 上 。USB 总 线 则 常用 于 较 小 的 外 国 
Ke, WHRERPUA, AA R wA 
种 常用 总 线 没 有 出 现在 图 1-30 中， 分 
别 是 Thunderbolt 和 高 清晰 多 媒体 接口 
( High-Definition Multimedia Interface, 
HDMI). Thunderbolt  PCle #1 % — $} 
总 线 DisplayPort 的 组 合体 ， 最 初 是 为 了 
视频 数据 而 研发 的 。 它 是 一 种 高 速 总 线 ， 
用 于 传输 诸如 视频 编辑 系统 所 需 的 大 量 


_ 数据。 HDMI 是 一 种 接口 ， 它 在 系统 组 


字 视 频 和 音频 信号 的 传输 ， 





统 的 主要 互 连 
计算 机 系统 和 用 


数据 库 系统 是 App7 层 最 常见 的 应 用 之 一 。 数 据 库 (database) 是 包括 相关 联 信息 的 文件 
汇集 ， 而 数据 库 系 统 (database system) (也 称 作 数 据 库 管理 系统 ，DBMS ) 是 一 个 让 用 户 在 
数据 库 中 添加 、 删 除 和 修改 记录 的 程序 ， 它 也 人 允许 对 数据 库 进 行 查询 。 查 询 (query) 是 对 信 
息 的 请 求 ， 所 请 求 的 信息 通常 来 自 数据 库 的 不 同 部 分 。 

举 个 数据 库 的 例子 ， 在 线 零售 商 维护 有 关 其 商品 库存 、 价 格 、 产 品 说 明 以 及 订单 的 信 
息 。 现 在 有 个 查询 ， 请 求 列 出 在 当天 结束 前 优先 发 往 特 定 国 家 的 所 有 商品 的 订单 数 。 为 了 生 
成 这 个 列表 ， 数 据 库 系统 将 来 自 数 据 库 中 不 同 部 分 的 信息 组 合 起 来 ， 在 这 个 例子 中 信息 来 自 
订单 文件 和 客户 地 址 文件 。 


1.5.1 关系 


关系 型 数据 库 系 统 (relational database system) 把 信息 存储 在 文件 中 ， 对 外 呈现 表 结构 。 
每 个 表 有 固定 的 列 数 和 可 变 的 行 数 。 图 1-31 是 一 个 关系 型 数据 库 中 信息 的 示例 。 每 个 表 有 
一 个 名 字 。 名 为 Sor 的 表 包 含 姐妹 会 成 员 的 信息 ， 名 为 Frat 的 表 包 含 兄 弟 会 成 员 的 信息 。 位 
于 App7 层 的 用 户 先 固定 每 个 表 中 垂直 的 列 数 ， 再 在 表 体 中 输入 信息 。 水 平方 向 的 行 数 是 可 
变 的 ， 这 样 能 够 在 表 中 增加 或 者 删除 人 员 。 

在 关系 型 数据 库 术 语 中 ， 表 称 作 关系 (relation)， 列 称 为 属性 (attribute)， 行 称 为 元 组 
(tuple, 45 couple 同 韵 )。 在 图 1-31 中 ，Sor 和 Frat 是 关系 , (Nancy, Jr, Math, NY) 是 
Sor 的 一 个 四 元 组 ， 因 为 它 有 4 个 元 素 ， 而 EMajor 是 Frat 的 一 个 属性 。 属 性 的 域 (domain ) 
是 该 属性 所 有 可 能 值 的 集合 。S.Major 和 FMajor 的 域 是 集合 THist，Math，CompSeci， 
PolySci, English} 
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PolySci 


Sam CompSci WA 
Ron Math OR 
Mehdi Math CA 
David English AZ 
Jeff Hist TX 
Craig English CA 
Gary CompSci CA 


图 1-31 一 个 关系 型 数据 库 的 示例 。 这 个 数据 库 包括 两 个 关系 : Sor 和 Frat 


15.2 ”查询 


查询 Ron 的 家 乡 州 、 查 询 姐 妹 会 中 所 有 二 年 级 学 生 的 名 字 ， 这 些 都 是 从 该 数据 库 进 行 
查询 的 例子 。 查 询 一 个 列表 、 列 出 所 有 具有 相同 专业 的 兄弟 会 和 姐妹 会 成 员 以 及 该 专业 的 名 
字 ， 是 另 一 个 查询 的 例子 。 

在 这 个 小 例子 中 ， 你 可 以 手工 搜索 数据 库 来 确定 每 个 查询 的 结果 。Ron 的 家 乡 州 是 OR， 
Beth 和 Allison 是 姐妹 会 中 二 年 级 的 学 生 。 第 三 个 查询 制 成 表格 稍微 有 点 难度 : Beth 和 Jeff 
是 历史 专业 ; Nancy 和 Ron 是 数学 专业 ，Nancy 和 Mehdi 也 是 ; Robin 和 Jeff 是 历史 专业 等 。 

有 趣 的 是 ， 每 个 查询 结果 都 可 以 用 表格 的 形式 列 出 来 ( 见 图 1-32 ) 。 第 一 个 查询 的 结果 
是 一 个 1 列 1 行 的 表格 ， 第 二 个 查询 的 结果 是 一 个 1 列 2 行 的 表格 ， 而 第 三 个 查询 的 结果 是 
一 个 3 列 8 行 的 表格 。 关 系 型 数据 库 是 关系 的 汇集 ， 而 一 个 对 关系 型 数据 库 的 查询 的 结果 本 
身 也 是 一 个 关系 ! 

查询 结果 本 身 就 是 关系 这 一 事实 是 关系 型 数据 库 系 统一 个 强大 的 理念 。Apps7 层 的 用 户 
把 数据 库 看 作 关系 的 汇集 ， 用 户 的 查询 就 是 请 求 从 数据 库 现 有 的 关系 中 衍生 出 另 一 个 关系 。 

记 住 每 层 都 有 自己 的 语言 。Apps7 层 关系 型 DBMS 的 语言 是 一 组 对 现 有 关系 进行 组 合 
或 者 修改 并 产生 新 关系 的 命令 。Apps7 层 的 用 户 使 用 这 些 命令 生成 想 要 的 结果 。 图 1-33 展 
示 了 数据 库 、 查 询 和 结果 之 间 的 关系 。 数 据 库 是 输入 ， 查 询 是 一 组 Apps7 层 语 言 写 的 命 
令 。 就 像 在 计算 机 系统 中 所 有 层次 上 一 样 ， 三 者 之 间 的 关系 都 是 一 样 的 形式 : 输入 、 处 理 和 
输出 。 

本 章 并 不 描述 市 场 上 每 种 关系 型 数据 库 系 统 的 每 一 种 语言 ， 这 些 语 言 大 多 都 是 被 称 为 
结构 化 查询 语言 (SQL) 标准 的 变 体 。 本 章 描 述 的 是 一 种 具备 这 样 一 些 系统 典型 特征 的 简 
化 语言 。 大 多 数 关系 型 DBMS 语言 有 许多 强大 的 命令 ， 而 其 中 有 3 个 命令 是 最 基础 的 一 一 


select、project 和 join。 
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Resultl Result2 
Pistate  S.Name $ f 
OR Beth 
Allison Nancy Ron Math 


Nancy Mehdi Math 


Robin Jeff Hist 
Allison Ron Math 
Allison Mehdi Math 
Lulwa Sam CompSci 
Lulwa Gary CompSci 


图 1-32 对 图 1-31 所 示 数据 库 进行 3 次 查询 的 结果 。 每 个 结果 都 是 一 个 关系 
输入 处 理 输出 
Dar Galen | 


图 1-33 数据库、 查询 和 结果 之 间 的 关系 


select 和 project 语句 类 似 ， 因 为 它们 都 是 对 单个 关系 进行 操作 ， 生 成 一 个 修改 的 关系 。 
select 语句 是 从 一 个 特定 的 表 中 提取 满足 语句 中 指定 条 件 的 行 。project 语句 是 根据 语句 中 指 
定 的 属性 从 一 个 特定 的 表 中 提取 一 组 列 。 图 1-34 演示 了 如 下 两 条 语句 的 结果 : 


select Frat where F.Major = English giving Templ 


All 


project Sor over S.Name giving Temp2 


Temp1 Temp2 






了 -Name F.Major F 8.) 
David English AZ Beth 
Craig English CA Nancy Jr NY 
a)Select Frat where F.Major Robin Sr CA 
= English giving Templ 
Allison Soph AZ 
Lulwa c) Project Sor over 
b) Project Sor over (S.Class, S.State) 
S.Name giving giving Temp3 
Temp2 


图 1-34 select 和 project 操作 符 
project 语句 可 以 指定 多 列 ， 此 时 属性 用 圆 括号 括 起 来 ， 并 用 逗号 分 隔 。 例 如 ， 


project Sor over (S.Class, S.State) giving Temp3 


是 从 Sor 关系 中 选 出 两 个 属性 。 
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注意 ， 1-34c 中 的 (Sr, CA) 对 是 关系 Sor ( 见 图 1-31) 中 的 四 元 组 ( Robin, Sr, 
Hist, CA) 和 (Lulwa, Sr, CompSci, CA) 都 有 的 ,但 是 这 一 对 在 关系 Temp3 中 不 重复 出 现 。 
关系 的 一 个 基本 性 质 就 是 在 任何 表 中 不 能 有 重复 的 行 。project 操作 符 会 检测 重复 行 ， 不 允许 
它们 存在 。 从 数学 上 说 ， 关 系 就 是 元 组 的 集合 ， 集 合 中 的 元 素 不 能 有 重复 。 

join 与 select 和 project 不 同 ， 它 的 输入 是 两 个 表 ， 而 不 是 一 个 。 第 一 个 表 的 一 列 和 第 二 
个 表 的 一 列 被 指定 作为 join 列 。 每 个 表 的 join 列 都 必须 有 相同 的 域 。 两 个 表 join 的 结果 是 
一 个 更 宽 的 表 ， 除 了 join 列 只 出 现 一 次 以 外 ， 它 的 列 和 两 个 表 中 原始 的 列 完全 相同 ; 结果 表 
的 行 就 是 两 个 原始 表 中 在 join 列 有 相同 元 素 的 那些 行 。 

例如 ， 在 图 1-31 中 ，S.Major 列 和 F.Major 有 相同 的 域 。 语 名 

join Sor and Frat over Major giving Temp4 
指定 Major 作为 join J), KA Sor 和 Frat 在 这 一 列 上 进行 合并 。 图 1-35 显示 了 两 个 表 join 
后 的 行 是 那些 专业 相同 的 行 。Sor 的 四 元 组 (Robin，Sr，Hist，CA) 和 Frat 的 三 元 组 ( Jeff， 

Hist，TX) 合并 在 Temp4 中 ， 因 为 它们 的 专业 (Hist) 是 一 样 的 。 





Nancy Jr NY Math Ron OR 
Nancy Jr NY Math Mehdi CA 
Robin Sr CA Hist Jeff TX 
Allison Soph AZ Math Ron OR 
Allison Soph AZ Math Mehdi CA 
Lulwa Sr CA CompSci Sam WA 
Lulwa Sr CA CompSci Gary CA 


图 1-35 join 操作 符 。 该 关系 来 自 于 语句 join Sor and Frat over Major giving Temp4 


15.3 语言 结构 
App7 层 语言 的 语句 有 如 下 格式 : 
select 关系 where 条 件 giving 关系 


project 关系 over 属性 giving 关系 
join 关系 and 关系 over 属性 giving 关系 


语言 的 保留 字 包 括 : 
select project 
join and 
where over 
giving 


正如 前 面 的 例子 展示 的 那样 ， 每 个 保留 字 在 语言 中 都 有 特定 的 含义 。 在 语言 中 标识 对 象 
的 单词 ， 例 如 Sor 和 Temp2 用 于 标识 关系 ， 而 F.state 用 于 标识 属性 ， 都 不 是 保留 字 。 它 们 
是 App7 层 的 用 户 随 意 生成 的 ， 称 为 标识 符 〈identifier)。 保 留 字 和 用 户 定义 的 标识 符 在 典型 
计算 机 系统 的 所 有 层 语 言 中 都 是 很 常见 的 。 
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你 知道 怎样 用 select, project 和 join 语句 来 生成 图 1-32 中 的 查询 结果 吗 ?” 第 一 个 查询 
Ron 的 家 乡 州 的 查询 语句 是 


select Frat where F.Name = Ron giving Temp5 
project Temp5 over F.State giving Resultl 


第 二 个 查询 姐妹 会 中 所 有 二 年 级 学 生 名 字 的 查询 语句 是 


select Sor where S.Class = Soph giving Temp6 
project Temp6 over S.Name giving Result2 


第 三 个 请 求 查 询 一 个 列表 ， 表 中 列 出 专业 一 样 的 兄弟 会 和 姐妹 会 的 成 员 以 及 他 们 共同 的 
专业 ， 该 查询 的 语句 是 


join Sor and Frat over Major giving Temp4 
project Temp4 over (S.Name, F.Name, Major) giving 
Result3 


本 章 小 结 


计算 机 科学 的 基本 问题 是 : 什么 能 够 被 自动 化 ? 计算 机 把 信息 处 理 自 动 化 了 。 本 书 的 主 
题 是 计算 机 系统 中 的 抽象 层次 。 抽 象 包括 隐藏 细节 以 展示 物质 的 本 质 ， 概 要 结构 ， 通 过 一 连 
串 的 命令 划分 责任 ， 以 及 将 一 个 系统 细 分 成 较 小 的 子 系统 。 一 个 典型 计算 机 系统 的 7 个 抽象 
层次 是 : 

第 7 层 (App7): 应 用 层 

第 6 层 (HOL6 ): 高 级 语言 层 

第 5 层 (Asmb5 ): 汇编 层 

第 4 层 (OS4 ): 操作 系统 层 

第 3 县 (ISA3 ): 指令 集 架构 层 

第 2 层 (Me2 ); 微 代 码 层 

第 1 层 (LG1): 逻辑 门 层 

每 层 都 有 自己 的 语言 ， 目 的 是 隐藏 更 低层 的 细节 。 

计算 机 系统 由 硬件 和 软件 组 成 。 硬 件 的 三 个 组 成 部 分 是 中 央 处 理 单元 、 主 存储 器 和 磁盘 
存储 器 。 在 这 三 个 部 分 中 ， 磁 盘 的 存储 容量 最 大 ,但 速度 最 慢 ; CPU 容量 最 小 ， 但 速度 最 
快 。 主 存 的 容量 和 速度 都 介 于 两 者 之 间 。 

控制 硬件 的 程序 叫 作 软件 。 算 法 是 一 组 指令 ， 依 照 适当 的 顺序 执行 ， 在 有 限 的 时 间 内 解 
决 问题 。 程 序 是 计算 机 上 执行 的 算法 。 程 序 输入 信息 、 处 理 信息 并 输出 结果 。 给 定 输入 和 程 
序 ， 软 件 就 会 分 析 并 确定 输出 。 给 定 输 入 和 想 要 的 输出 ， 软 件 就 会 设计 确定 程序 。 操 作 系 统 
是 一 种 大 型 程序 ， 向 用 户 提供 计算 机 的 人 机 接口 。 它 管理 文件 、 主 存 和 处 理 器 。 

数字 信息 的 最 小 单位 是 二 进 制 位 ， 也 称 为 比特 。 计 算 机 系统 中 的 每 一 位 都 要 占用 空间 。 
所 有 存储 在 计算 机 系统 中 的 信息 ， 如 数字 、 文 本 和 图 像 等 都 是 位 的 集合 。8 位 就 是 一 个 字 节 。 
用 nn 位 序列 存储 数值 ， 则 数值 个 数 为 2"。 存 储 一 个 ASCII 字符 需要 一 个 字 节 ， 即 8 位 。 

除了 空间 之 外 ,计算 机 系统 中 所 有 的 计算 还 要 占用 时 间 。 计 算 机 系统 中 的 计算 时 间 由 
两 部 分 组 成 : CPU 执行 指令 集中 一 条 指令 所 需要 的 时 间 ， 以 及 把 信息 从 系统 的 一 个 组 件 传 
递 到 另 一 个 组 件 所 需要 的 传输 时 间 。 系 统 性 能 公式 用 三 个 项 的 乘积 计算 程序 任务 的 总 执行 
时 间 : 
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时 间 _ 指令 数 、 时 名 周期 数 时 间 


程序 AÑ 指令 时 钟 周期 
带宽 公式 用 两 个 项 的 乘积 计算 传输 的 总 信息 量 : 
信息 是 = .信息 坚 x tig 
` 时 间 


乘积 的 第 一 项 是 通道 带宽 ， 第 二 项 是 传输 时 间 。 

QR 网 格 中 一 个 方 格 存储 QR 码 的 一 位 信息 。 黑 色 方 格 表示 二 进 制 1， 白 色 方 格 表示 二 
进 制 0。 网 格 内 的 方 格 越 多 ，QR 码 所 含 的 信息 量 越 大 。 计 算 机 系统 中 的 图 像 是 一 个 像素 网 
格 。 黑 白 图 像 的 每 个 像素 需要 1 位 表示 。 灰 度 图 像 的 位 深 指 的 是 每 个 像素 的 位 数 ， 它 决定 
了 每 个 像素 能 够 显示 多 少 种 灰 度 。 彩 色 图 像 的 每 个 像素 需要 三 种 子 像素 一 一 红色 、 绿 色 和 
蓝 色 。 

数据 库 系统 是 App7 层 最 常见 的 一 种 应 用 。 关 系 型 数据 库 系统 把 信息 存储 在 呈现 为 表 结 
构 的 文件 中 ， 这 个 表 称 作 关 系 。 关 系 型 数据 库 系统 中 的 查询 结果 本 身 就 是 关系 。 关 系 型 数据 

库 系统 中 最 基本 的 3 个 操作 是 select, project 和 join, AIX 3 种 操作 的 组 合 。 


练习 


本 书 每 章 的 最 后 都 有 一 组 练习 和 编程 题 。 请 在 纸 上 手 工 完成 这 些 练习 。 带 星 号 练习 的 答案 见 本 书 

的 最 后 (对 一 些 有 多 个 部 分 的 练习 ， 可 能 只 有 部 分 答案 )。 编 程 题 是 要 输入 计算 机 中 的 程序 ， 本 章 仅 包 

括 练习 。 

AA 

1. (a) 请 画 一 个 对 应 美国 宪法 的 层次 结构 图 。 

(b) 依照 图 1-5， 画 一 个 对 应 假想 出 版 公司 的 组 织 结构 符 套 图 。 
2. 成 吉 思 汗 把 他 的 战士 以 10 人 为 一 组 组 成 十 人 队 ， 由 “ 什 长 ”率领 ;10 个 “ 什 长 ”由 1 “ARR” 
率领 ;10 个 “ 百 夫 长 ”由 1 个 “千夫 长 ”率领 。 
*(a) 如 果 成 吉 思 汗 在 最 低层 有 10 000 名 战士 ， 那么 他 手下 总 共有 多 少 人 ? 
(b) 如 果 成 吉 思 汗 在 最 低层 有 5763 ARE, 那么 他 手下 总 共有 和 多少 人 ? 假设 如 果 可 能 ， 每 个 10 人 
组 应 该 包含 10 人 ,但 是 每 层 可 能 有 一 组 会 少 于 10 A. 

3. 在 《圣经 》 中 ,《 出 埃及 记 》 第 18 章 讲 述 了 作为 以 色 列 唯一 法 官 的 摩西 由 于 要 处 理 大 量 琐碎 的 案件 
而 疲惫 不 堪 。 他 的 岳父 叶 特 罗 向 他 推荐 了 上 诉 法 院 的 分 层 体系 ， 在 这 个 体系 中 ， 最 底层 的 法 官 负责 
10 个 市 民 ，5 个 管理 10 个 市 民 的 法 官 将 他 们 不 能 解决 的 疑难 案件 交 由 一 个 负责 50 个 市 民 的 法 官 处 
理 ; 2 个 负责 50 个 市 民 的 法 官 在 一 个 负责 100 个 市 民 的 法 官 手下 工作 ; 10 个 能 负责 100 个 市 民 的 
法 官 在 一 个 负责 1000 个 市 民 的 法 官 手下 工作 ， 能 负责 1000 个 市 民 的 法 官 向 摩西 汇报 ， 这 样 摩西 只 
需 处 理 最 棘手 的 案件 。 

*(a) 如 果 市 民 人 口 正 好 是 2000 人 【不 包括 法 官 )， 画 出 分 层 体系 最 上 面 的 三 层 。 

(b) Æ (a) 中 ,包括 摩西 、 所 有 法 官 和 市 民 的 总 人 口 是 多 少 ? 

(c) 如 果 市 民 人 口 正好 是 10 000 人 (不 包括 法 官 )， 包 括 摩 

西 、 所 有 法 官 和 市 民 的 总 人 口 是 多 少 ? 

完全 二 又 树 的 叶子 结 点 都 在 同一 层 ， 而 每 个 非 叶 子 结 点 下 

面 正 好 有 2 个 结 点 。 图 1-36 是 一 个 三 层 的 完全 二 叉 树 。 

*(a) 请 画 出 一 个 四 层 的 完全 二 又 树 。 
*(b) 一 个 五 层 的 完全 二 叉 树 总 共有 和 多少 个 结 点 ? 
(c) 六 层 的 呢 ? 图 1-36 练习 4: 三 层 的 完全 二 叉 树 


> 
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(d) #4 层 的 呢 ? 

12% 

5. 判断 真 假 。 

(a) 主 存 是 易 失 性 的 。 

(b) 主 存 是 顺序 访问 的 。 

(c) 磁盘 存储 器 是 易 失 性 的 。 

(d) 磁盘 存储 器 是 顺序 访问 的 。 

(e) 主 存 容 量 大 于 磁盘 存储 器 容量 。 

(f) 主 存 访问 时 间 快 于 磁盘 存储 器 。 

1.3 $ 

6. (a) 什么 是 算法 ? 

(b) 什么 是 程序 ? 

7. 根据 你 的 操作 系统 回答 问题 。 

(a) 你 的 操作 系统 名 称 是 什么 ? 

(b) 特定 的 字符 不 允许 做 文件 名 吗 ? 如 果 这 样 的 字符 用 在 文件 名 中 ， 有 问题 吗 ? 

Ce) 你 的 操作 系统 对 文件 名 区 分 大 小 写字 母 吗 ? 

. 在 你 的 操作 系统 中 ， 怎 样 执行 下 面 的 步骤 。 

(a) 建立 一 个 新 的 用 户 账户 。 

(b) 显示 根 目 录 下 的 文件 名 和 子 目录 名 。 

(c) 删除 磁盘 上 的 一 个 文件 。 

(d) 更 改 一 个 文件 的 名 字 。 

(e) 复制 一 个 文件 。 

(f) 显示 文件 的 大 小 。 

(g) 显示 最 近 修改 文件 的 时 间 。 

1.4 节 

9. 设 应 用 程序 完成 一 个 任务 需要 执行 2000 万 条 指令 ， 已 知 CPU 的 频率 为 2.1GHz， 求 该 任务 的 执行 
时 间 ? 假设 每 条 ISA3 指令 平均 需 执行 4.5 条 Mc2 指令 。 

10. 设 应 用 程序 完成 一 个 任务 需要 执行 3000 万 条 指令 ， 已 知 CPU 的 频率 为 2.8GHz， 求 该 任务 的 执行 
时 间 ? 假设 每 条 ISA3 指令 平均 需 执行 7.3 条 Mc2 指令 。 

11. 已 知 DMA 通道 带宽 为 2.5GB/s， 现 将 600MB 数据 库 从 磁盘 传输 到 主 存 ， 求 所 需 时 间 是 多 少 ? 

*12. 一 个 打字 员 以 每 分 钟 40 个 单词 的 速度 在 键盘 上 输入 文本 。 如 果 每 个 单词 的 平均 长 度 是 5 个 字符 ， 
那么 每 秒 有 多 少 比 特 从 键盘 传送 到 主 存 呢 ? 一 个 空格 也 是 一 个 字符 ， 假 定 平均 每 个 单词 后 面 有 一 个 
空格 。 

13. 一 个 打字 员 以 每 分 钟 30 个 单词 的 速度 在 键盘 上 输入 文本 。 如 果 每 个 单词 的 平均 长 度 是 6 个 字符 ， 
那么 每 秒 有 多 少 比特 从 键盘 传送 到 主 存 呢 ? 一 个 空格 也 是 一 个 字符 ， 假 定 平均 每 个 单词 后 面 有 一 个 
空格 。 

14. 版 本 4 QR 码 的 网 格 中 一 共存 储 了 多 少 位 ? 

*15. (a) 版 本 8 QR 码 的 49 x 49 网 格 中 ， 有 多 少 位 可 以 存储 信息 ? 该 版 本 有 四 个 校准 图 形 不 与 定位 图 形 

相交 ， 有 两 个 校准 图 形 与 定位 图 形 相交 ， 还 有 两 个 18 位 的 版 本 信息 区 。 
(b) 如 果 模 式 、 字 符 计数 和 M 级 纠 错 所 占 开销 为 37%， 那 么 该 QR 码 可 以 存储 多 少 个 字符 ? 

16.(a) 版 本 10 QR 码 的 57 x 57 网 格 中 ， 有 多 少 位 可 以 存储 信息 ? 该 版 本 有 四 个 校准 图 形 不 与 定位 图 

形 相 交 ， 有 两 个 校准 图 形 与 定位 图 形 相 交 ， 还 有 两 个 18 位 的 版 本 信息 区 。 
(b) 如 果 模 式 、 字 符 计数 和 工 级 纠 错 所 占 开销 为 22%， 那 么 该 QR 码 可 以 存储 多 少 个 字符 ? 
17.(a) 台式 激光 打印 机 的 分 辩 率 为 300 点 / 英寸。 如 果 每 个 点 用 存储 器 中 的 一 位 来 存储 ， 那 么 一 个 8.5 
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英寸 x 11 英寸 纸张 的 完整 图 像 需要 的 存储 空间 是 多 少 MiB ? 
(b) 如 果 打 印 机 的 分 辨 率 为 1200 点 /英寸 ， 又 需要 多 少 MiB ? 
18. eReader 的 灰 度 显示 器 为 956 x 1290 像素 ， 每 个 像素 可 以 显示 32 种 灰 度 。 问 该 设备 的 显示 存储 器 
大 小 为 多 少 KiB ? 
19. 移动 手机 屏幕 大 小 为 3.48 英寸 x 1.96 英寸 ， 分 辨 率 为 326 像素 / 英寸 。 
(a) 像素 总 数 是 多 少 ? 
(b) 如 果 每 个 色彩 子 像素 都 有 256 个 亮度 级 ， 那 么 显示 存储 器 的 大 小 是 多 少 MiB ? 
20. 平板 电脑 屏幕 大 小 为 7.5 英寸 x 5.8 英寸 ， 分 辩 率 为 326 像素 /英寸 。 
(a) 像素 总 数 是 多 少 ? 
(b) 如 果 每 个 色彩 子 像素 都 有 256 个 亮度 级 ， 那 么 显示 存储 器 的 大 小 是 多 少 MiB ? 
1.5 节 
*21. 根据 本 章 1.5 节 中 的 讨论 ， 写 出 关系 Temp5 和 Temp6。 
22. 写 出 对 图 1-31 中 的 数据 库 进 行 下 列 查询 的 语句 。 
* (a) 找 出 Beth 的 家 乡 州 。 
(b) 列 出 英语 专业 的 兄弟 会 成 员 。 
(c) 列 出 有 相同 家 乡 州 的 兄弟 会 和 姐妹 会 成 员 以 及 家 乡 州 的 名 字 。 
rý 23. (a) 写 出 生成 图 1-32 中 Result2 的 语句 ， 但 是 要 先 用 project 命令 ， 再 用 select 命令 。 
52 (b) 写 出 生成 图 1-32 中 Result3 的 语句 ， 但 是 最 后 一 条 语句 需 是 join。 
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C 





程序 输入 信息 、 处 理 信息 并 输出 结果 。 本 章 展示 了 一 个 C 程序 怎样 输入 、 处 理 和 输出 
数值 。 本 章 讲述 HOL6 层 的 编程 ， 我 们 假定 你 已 经 有 一 些 用 高 级 语言 编程 的 经 验 ， 不 一 定 非 
要 是 C， 例 如 可 以 是 C++, Java 或 Python。 因 为 本 书 表达 的 概念 对 所 有 这 些 语 言 都 是 通用 
的 ， 所 以 即便 可 能 与 你 熟悉 的 语言 有 所 不 同 ， 你 也 能 够 看 懂 本 章 讨论 的 内 容 。 


2.1 变量 


计算 机 能 够 直接 执行 的 只 有 ISA3 Je (指令 集 染 
HE) 上 的 机 器 语言 语句 。 因 此 HOL6 层 的 语句 必须 
先 被 翻译 到 ISA3 层 ， 然 后 才能 执行 。 图 2-1 展示 了 
编译 器 的 功能 ， 它 执行 从 HOL6 层 语 言 到 1SA3 层 语 
言 的 翻译 工作 。 这 个 图 展示 了 到 第 3 层 的 翻译 ， 有 些 
编译 器 是 从 第 6 层 翻译 到 第 $ 层 ， 然 后 再 要 求 从 第 5 
层 翻译 到 第 3 层 。 





2.1.1 C 编译 器 
为 了 执行 本 书 中 的 程序 ， 需 要 有 一 个 C 编译 器 。 
运行 程序 分 为 3 个 步骤 : 
。 在 文本 编辑 器 中 用 C 语言 写 程序 ， 这 个 版 本 ”图 2-1 编译 器 的 功能 ， 把 用 第 6 导语 
叫 作 源 程序 。 言 编写 的 程序 翻译 为 等 价 的 较 
o 调用 编译 器 把 源 程 序 从 C 翻译 或 编译 为 机 器 低层 语言 描述 的 程序 


语言 ， 机 器 语言 的 版 本 叫 作 目 标 程序 。 

。 执 行 目标 程序 。 

有 些 系统 允许 用 一 条 命令 去 指定 后 面 的 两 个 步 又， 通常 叫 作 “运行 ”命令 。 无 论 是 否 分 
开 编 译 和 执行 ，HOL6 层 的 程序 在 执行 前 都 必须 进行 翻译 。 

当 你 写 源 程序 时 ， 它 像 其 他 文本 文档 一 样 保存 在 磁盘 文件 中 。 编 译 器 将 生成 另 一 个 称 为 
代码 文件 的 目标 程序 文件 。 编 译 后 目标 程序 在 你 的 文件 目录 中 是 否 可 见 取决 于 你 的 编译 器 。 

如 果 想 执行 一 个 之 前 编译 过 的 程序 ， 就 不 需要 再 翻译 它 ， 只 需 直 接 执行 目标 程序 即 可 。 
如 果 删 掉 了 磁盘 上 的 目标 程序 ， 总 是 可 以 通过 再 编译 源 程序 来 恢复 它 。 但 是 翻译 只 能 从 高 层 
到 低层 ， 如 果 删 除了 源 程序 ， 那 么 不 能 从 目标 程序 恢复 它 。 

C 编译 器 是 软件 ， 不 是 硬件 。 它 存储 在 磁盘 上 的 
文件 中 。 像 所 有 的 程序 一 样 ， 编 译 器 有 输入 、 处 理 和 输入 处 理 输出 
生成 输出 这 3 个 过 程 。 从 图 2-2 中 可 以 看 到 编译 器 的 。 | 站 各 序 | 一 >( 编译 器 je 
输入 是 源 程序 ， 而 输出 是 目标 程序 。 图 2.2 编译 器 是 一 个 程序 


2.1.2 机 器 无 关 性 


ISA3 层 语言 是 与 机 器 相关 的 。 使 用 ISA3 层 语 言 写 的 用 于 在 X 品 牌 计算 机 上 执行 的 程 
序 ， 是 不 能 在 Y 品牌 计算 机 上 运行 的 。HOL6 层 语言 的 


一 个 重要 性 质 就 是 它们 与 机 器 无 关 。 如 果 用 HOL6 层 语 
言 写 了 一 个 程序 用 于 在 X 品牌 计算 机 上 执行 ， 那么 只 需 
稍 加 修改 ， 它 就 可 以 在 Y 品牌 计算 机 上 运行 。 


图 2-3 展示 了 C 怎样 实现 它 的 机 器 无 关 性 。 假 设 用 
C 写 了 一 个 做 统计 分 析 的 应 用 程序 。 既 想 把 它 卖 给 有 XX 
品牌 计算 机 的 人 ， 也 想 把 它 卖 给 有 YY 品牌 计算 机 的 人 。 

只 有 当 这 个 统计 程序 是 机 器 语言 格式 时 才能 执行 。 因 为 

机 器 语言 是 与 机 器 相关 的 ， 所 以 需要 两 个 机 器 语言 的 版 
AS: 义 品 牌 一 个 ，Y 品牌 一 个 。 因 为 C 是 一 种 常用 的 高 

级 语言 ， 所 以 应 该 有 和 X 品牌 机 器 的 C 编译 器 和 YY 品牌 图 2-3 HOL6 层 语言 的 机 器 无 关 性 
机 器 的 C 编译 器 。 如 果 这 样 的 话 ， 那 么 只 需 在 一 台 机 器 


上 调用 和 X 品牌 的 C 编译 器 生成 X 品牌 机 器 语言 版 本 ， 在 另 一 台 机 器 上 调用 YY 品牌 的 C 编译 
器 生成 Y 品牌 机 器 语言 版 本 ， 而 你 需要 做 的 就 是 只 写 一 个 C 程 序 。 


2.14.3 C 的 内 存 模型 


C 编程 语言 有 3 种 不 同类 型 的 变量 : 全 局 变量 、 局 部 变量 和 动态 分 配 变量 。 变 量 的 值 存 
储 在 计算 机 的 主 存 中 ,但 是 变量 存储 的 位 置 则 取决 于 变量 的 类 型 。3 种 类 型 的 变量 分 别 对 应 
存储 器 中 3 个 特定 的 区 域 : 

e 全 局 变量 存放 在 内 存 中 的 固定 位 置 。 

© 局 部 变量 和 参数 存放 在 运行 时 栈 上 。 

© 动态 分 配 变 量 存放 在 堆 上 。 

全 局 变量 的 声明 在 所 有 函数 的 外 面 ， 且 在 程序 的 执行 过 程 中 位 置 保持 不 变 。 局 部 变量 在 
函数 中 声明 ， 函 数 被 调用 时 它们 出 现 ， 函 数 结束 时 它们 消失 。 动 态 分 配 变量 随 着 malloc() K 
数 的 执行 出 现 ， 随 着 free) 函数 的 执行 消失 。 

栈 是 一 个 值 的 容器 ， 通 过 压 人 (push) 操作 存 人 值 ， 通 过 弹出 (pop) 操作 取出 值 。 存 
和 人 和 取出 值 的 原则 是 后 进 先 出 ， 即 当 从 栈 中 弹出 一 个 值 时 ， 取 出 的 是 最 后 一 个 压 人 栈 的 值 。 
正 因 如 此 ， 有 时 候 栈 也 被 称 为 LIFO 表 ，LIFO 是 “Last In, First Out”( 后 进 先 出 ) 的 首 字 和 母 
缩写 。 

每 条 执行 的 C 语句 是 一 个 函数 的 一 部 分 。C 函数 有 一 个 返回 类 型 、 一 个 名 字 和 一 个 参数 
表 。 程 序 包括 一 个 名 为 main ( 主 函数 ) 的 特殊 函数 ， 该 函数 被 操作 系统 调用 。 通 过 执行 主 函 
数 中 的 语句 来 执行 程序 。 主 函数 中 的 语句 有 可 能 调用 另 一 个 函数 。 当 执行 一 个 函数 时 ， 按 照 
如 下 顺序 对 运行 时 栈 的 空间 进行 分 配 : 

o 压 人 返回 值 的 存储 空间 。 

e KALE, 

e 压 人 返回 地 址 。 

e 压 人 局 部 变量 的 存储 空间 。 

当 函 数 结束 时 ， 按 照相 反 的 顺序 释放 运行 时 栈 的 存储 空间 : 
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o 弹出 局 部 变量 。 
o 弹出 返回 地 址 ， 根 据 返回 地 址 确定 要 执行 的 下 一 条 语句 。 
。 弹出 参数 。 


o 弹出 返回 值 ， 按 照 调 用 语句 指定 方式 进行 使 用 。 
不 管 一 个 函数 是 主 函 数 ， 还 是 在 另 一 个 函数 中 被 一 条 语句 调用 的 函数 ， 都 会 执行 上 述 这 
[58] 些 步骤 。 
本 章 的 程序 说 明 C 编程 语言 的 内 存 模型 。 后 面 的 章节 将 展示 编译 器 把 同样 的 程序 翻译 
到 Asmbs 层 后 的 目标 代码 。 


2.14 全 局 变量 和 赋值 语句 

每 个 C 变量 有 3 个 属性 : 

© AF. 

。 类 型 。 

e 值 。 

变量 名 是 程序 员 任 意 确定 的 标识 符 。 变 量 类 型 指定 变量 值 的 可 能 类 型 。 图 2-4 展示 的 程 
序 声明 了 两 个 全 局 变量 ,输入 它们 的 值 ， 对 它们 的 值 进行 操作 ,然后 输出 结果 。 这 个 程序 没 
有 实际 的 意义 ， 它 的 唯一 目的 就 是 说 明 C 程序 的 一 些 特点 。 


// Stan Warford 


// A nonsense program to illustrate global variables 


#include <stdio.h> 


char ch; 
int j; 
int main() { 
scanf ("%c Sd", &ch, &j); 
j += 5; 
ch++; 
printf ("%c\ntd\n", ch, j); 
return 0; 





图 2-4 全 局 变量 赋值 语句 


图 2-4 的 前 两 行 是 注释 ， 编 译 器 会 忽略 注释 。C 源 程序 中 的 注释 以 两 条 斜 杠 // 开始 直到 
本 行 结束 。 程 序 接 下 来 的 一 行 是 
#include <stdio.h> 


它 是 一 个 编译 器 指令 (compiler directive)， 使 得 程序 能 够 使 用 函数 库 。 在 这 个 例子 中 ， 
库 文件 stdio.h 代表 标准 输入 /输出 (standard input/output)， 它 包含 了 后 面 的 程序 使 用 的 输入 
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函数 scanf() 和 输出 函数 printf()。 所 有 要 使 用 scanf() 和 printf() 的 程序 都 需要 这 条 指令 或 者 
类 似 的 指令 。 
程序 中 接 下 来 的 两 行 


char ch; 

int j; 
声明 了 两 个 全 局 变量 。 第 一 个 变量 的 名 字 是 ch， 它 的 类 型 是 字符 型 ， 是 由 变量 名 前 面 的 关 
键 字 char 来 指定 的 。 和 大 多 数 变 量 一 样 ， 声 明 并 不 能 确定 它 的 值 ， 而 必须 从 一 个 输入 语句 
获得 值 。 第 二 个 变量 的 名 字 是 j， 类 型 是 整 型 ， 由 int 指定。 每 个 C 程序 都 有 一 个 包含 可 执 
行 语 句 的 主 函 数 。 在 图 2-4 中 ， 因 为 变量 是 在 主 程序 外 声明 的 ， 所 以 它们 是 全 局 变量 。 

程序 中 接 下 来 的 一 行 


int main() { 


声明 了 主 程序 是 一 个 返回 一 个 整数 的 函数 。C 编译 器 必须 生成 能 在 特定 操作 系统 上 执行 的 代 
码 ， 由 操作 系统 来 解释 返回 值 。 标 准 惯例 是 ， 返 回 值 为 0 表示 程序 执行 中 没有 发 生 错误 。 如 
果 发 生 了 执行 错误 ， 则 程序 中 断 ， 然 后 返回 一 些 非 零 的 值 ， 不 会 执行 到 main’) 的 最 后 一 条 
可 执行 语句 。 这 种 情况 下 ， 如 何 处 理 取决 于 操作 系统 和 错误 的 类 型 。 本 书 中 所 有 的 C 程序 
都 遵循 通常 的 惯例 : 返回 0 作为 主 函数 的 最 后 一 条 可 执行 语句 。 

图 2-4 中 第 一 条 可 执行 语句 是 


scanf ("%c %d", &ch, &j); 


第 一 个 参数 "%c %d" 是 格式 字符 串 ， 含 有 两 个 转换 符 %c 和 %d。 第 二 个 和 第 三 个 参数 
分 别 是 &ch 和 &j， 用 于 接收 输入 的 值 。 标 准 输入 设备 可 以 是 键盘 或 磁盘 文件 。 在 Unix 环境 
下 ， 默 认输 入 设备 为 键盘 。 执 行程 序 时 ， 可 以 将 输入 重 定向 为 来 自 磁盘 文件 。 这 条 输入 语句 
将 输入 流 中 的 第 一 个 值 给 ch， 将 第 二 个 值 给 j。 

格式 化 字符 串 中 的 转换 指示 符 是 占 位 符 ， 与 参数 列表 中 其 他 参数 按 序 对 应 。 图 2-4 中 ， 
占 位 符 Yoo 对 应 参数 &ch， 占 位 符 %d 对 应 参数 &j。 占 位 符 %e 指示 程序 扫描 到 一 个 字符 就 
送 入 变量 ch， 占 位 符 %d 指示 程序 扫描 到 任意 一 个 带 符号 十 进 制 整 数 就 送 入 变量 j。 符 号 & 
是 C 的 地 址 运算 符 ， 它 是 scanf() 函数 中 的 变量 所 必需 的 。 由 于 了 艺 数 会 改变 变量 的 值 ， 所 以 
需要 的 是 变量 在 主 存 中 的 存储 地 址 ， 而 不 是 该 变量 的 数值 。 

%c 和 Yod 之 间 的 空格 告诉 输入 扫描 程序 忽略 空白 字符 ， 比 如 空格 和 整数 前 面 的 制 表 符 。 
输入 时 ， 可 以 在 数字 419 前 面 加 任意 个 空格 ， 而 输出 不 会 变化 。 但 是 ， 如 果 空 格 出 现在 字符 
M 的 前 面 ， 程 序 将 会 出 错 ， 因 为 ch 得 到 的 是 空格 符 。 如 果 想 在 输入 字符 前 面 允 许 出 现任 意 
个 空格 ， 就 需要 在 格式 字符 串 的 %e 占 位 符 前 加 一 个 空格 。 

第 二 条 可 执行 语句 是 : 


j += 5; 


C 中 的 赋值 运算 符 是 =， 在 英语 中 读 作 “gets”( 意 为 获得 ， 在 中 文 里 一 般 读 作 “ 等 于 ”)。 
上 面 这 条 语句 和 下 面 的 语句 是 等 价 的 : 

J = J + 5; 
英文 中 读 作 “j gets j plus five” (BW j 的 值 为 ] 加 上 5 )。 

和 某 些 编程 语言 不 同 ，C 把 字符 当 作 整数 ， 可 以 对 它们 进行 运算 。 下 面 这 条 可 执行 语句 
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ch++; 
用 增 量 运算 符 对 ch 加 1， 它 等 价 于 赋值 语句 


ch = ch + 1; 


接 下 来 的 可 执行 语句 是 


printf ("%c\n¢d\n", ch, j); 


这 个 输出 函数 使 用 了 格式 字符 串 "%c Md \n", 其 中 %c 和 Md 仍然 是 占 位 符 ， 分 别 对 应 
于 后 面 的 参数 ch 和 j。 标准 输出 设备 可 以 是 显示 屏 也 可 以 是 磁盘 文件 。 在 Unix HEP, BR 
认 的 输出 设备 是 显示 屏 。 执 行程 序 时 ， 可 以 把 输出 重 定向 到 一 个 磁盘 文件 。\ n 是 换行 符 。 
这 条 输出 语句 把 变量 ch 的 值 传送 到 输出 设备 ， 然 后 把 光标 移 到 下 一 行 的 开始 位 置 ， 把 变量 j 
的 值 传送 到 输出 设备 ， 再 把 光标 移 到 下 一 行 的 开始 位 置 。 函 数 printf) 不 在 变量 前 使 用 & 的 
原因 是 它 不 会 改变 变量 的 值 。 相 反 ， 它 输出 这 些 变量 已 有 的 值 。 

图 2-5 展示 了 图 2-4 所 示 程 序 在 结 
束 前 的 内 存 模型 。 全 局 变量 ch 和 j 的 存 


储 空间 是 在 内 存 的 固定 位 置 上 分 配 的 ， en seen 
如 图 2-5a 所 示 。 j TA hea 


记 住 ， 当 一 个 函数 被 调用 时 ， 运 行 
时 栈 上 分 配 了 4 项 : 返回 值 、 参 数 、 返 
回 地 址 和 局 部 变量 。 由 于 这 个 程序 的 主 
函数 没有 参数 和 局 部 变量 ， 所 以 在 运行 
时 栈 上 仅 分 配 了 标记 为 retVal 的 返回 值 和 标记 为 retAddr 的 返回 地 址 的 存储 空间 ， 如 图 2-5b 
所 示 。 图 中 显示 的 返回 地 址 值 是 ra0， 这 是 程序 结束 时 操作 系统 将 执行 的 指令 的 地 址 。 对 于 
HOL6 层 的 我 们 来 说 ，OS4 层 操作 系统 的 细节 是 隐藏 的 。 


2.1.5 ”局 部 变量 
全 局 变量 在 主 存 的 固定 位 置 进行 分 


配 ， 而 局 部 变量 则 是 在 运行 时 栈 上 进行 winclnges: <stdio.h> 
分 配 。 在 C 程序 中 ， 局 部 变量 在 主 程序 int main() { 


a) 固定 位 置 b) 运行 时 栈 
图 2-5 图 2-4 所 示 程 序 的 内 存 模型 


内 声明 。 图 2-6 所 示 的 程序 声明 了 一 个 So ee i A 
常量 和 3 个 局 部 变量 ,3 个 局 部 变量 分 oe 

别 表 示 一 门 课 程 的 两 次 考试 分 数 和 一 个 int score; 

总 分 ， 总 分 是 两 次 考试 分 数 的 平均 分 加 |。 senti Nah. Geran kena) 
上 奖励 分 。 


printf ("score = %d\n", score); 


在 第 一 个 变量 前 面 的 是 常量 bonus。 return 0; 
与 变量 一 样 ， 常 量 有 名 字 、 类 型 和 值 。 
不 过 ， 与 变量 不 同 的 是 ， 常 量 的 值 不 会 
改变 。 初 始 化 运算 符 = 将 这 个 常量 的 值 
指定 为 10。 

图 2-6 中 的 第 一 条 可 执行 语句 是 ree ae 





scanf ("%d $d", &examl, &exam2) ; 图 2-6 ”处理 3 个 局 部 整 型 值 的 C 程序 
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它 把 输入 流 中 的 第 一 个 值 赋 给 exam1， 第 二 个 值 赋 给 exam2。 第 二 条 可 执行 语句 是 
score = (examl + exam2) / 2 + bonus; 


它 把 exam! 和 exam2 的 值 相 加 得 到 的 和 除 以 2 获得 它们 的 平均 值 ， 再 加 上 奖励 分 ， 接 着 把 
这 个 值 赋 给 变量 score。 因 为 exam], exam2 和 2 都 是 整数 ， 所 以 除法 运算 符 /代表 整数 除 
法 。 如 果 exam! 和 exam2 之 一 被 声明 为 浮 点 型 ， 或 者 除数 写作 2.0 而 不 是 2， 那么 除法 运算 
符 就 代表 浮 点 数 除 法 。 整 数 除法 会 截 掉 余数 ， 而 浮 点 数 除法 会 保留 小 数 部 分 。 要 输出 浮 点 变 


量 的 值 ， 需 在 格式 字符 串 中 使 用 %f 转换 符 。 
如 果 图 2-6 所 示 程 序 的 输入 是 
68 85 

那么 输出 仍然 是 


score = 86 
考试 分 数 和 是 153。 如 果 用 153 除 以 2.0， 得 到 浮 点 数值 76.5。 但 是 ， 如 果 用 153 除 以 2, 
运算 符 /代表 整数 除法 ,小数 部 分 被 截 掉 ， 或 者 说 砍 掉 ， 得 到 76。 m 
如 果 把 score 声明 为 双 精 度 浮 点 型 ， 如 下 所 示 : 


double score; 
并 且 通 过 将 2 改 为 2.0 把 除法 强制 为 浮 点 数 除 法 ， 如 下 所 示 : 
score = (examl + exam2) / 2.0 + bonus; 
那么 当 输 入 是 68 和 85 时， 输出 是 


score = 86.5 


两 个 数 的 浮 点 除法 仅 生成 一 个 值 ， 即 商 。 然 而 ， 整 数 除 法 生成 两 个 值 一 一 商 和 余数 ， 两 
者 都 是 整 型 。 可 以 用 C 的 模 运 算 符 % 计算 整 型 除法 的 余数 。 图 2-7 展示 了 一 些 整 型 除法 和 
模 运 算 的 例子 。 





表达 式 a Ay = i m 
15/3 5 15%3 0 
14/3 4 14%3 2 
13/3 4 13%3 1 
12/3 4 12%3 0 
11/3 3 11%3 2 
图 2.7 一些 整数 除法 和 模 运算 的 例子 
2-8 展示 了 图 2-6 所 示 程 序 中 的 局 score score 
部 变量 的 内 存 模型 。 计 算 机 在 运行 时 栈 exam2 sais 
上 给 所 有 的 局 部 变量 分 配 存储 空间 。 当 exam1 Sai. 
main() 执行 时 ， 返 回 值 、 返 回 地 址 、 局 retAddr retAddr 
部 变量 (examl, exam2 和 score) 被 压 KeNaN retVal . 
入 栈 中 。 因 为 bonus 不 是 变量 ， 所 以 它 a) 输入 语 句 执行 前 。。”b) 输入 语句 执行 后 


不 会 入 栈 。 图 2-8 图 2-6 所 示 程 序 中 的 局 部 变量 的 内 存 模型 
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2.2 控制 流 


A (Re 6 &) 





程序 是 按照 一 条 语句 接着 一 条 语句 的 方式 顺序 执行 的 。 oe oe Gen) 
有 两 种 方式 可 以 改变 控制 流 ， 进 而 改变 程序 顺序 : 选择 和 == 等 于 
循环 。C 的 让 和 switch 语句 用 于 选择 ，while、do 和 for 语 < INF 
句 用 于 循环 。 每 一 条 语句 都 执行 一 个 可 能 改变 控制 流 顺 序 <= 小 于 等 于 
的 测试 。 最 常见 的 测试 是 用 图 2-9 所 示 的 6 种 关系 运算 符 大 于 
之 一 进行 的 。 >= 大 于 等 于 
不 等 于 


2.2.1 if/else 语句 


图 2-10 给 出 了 一 个 C 


图 2-9 关系 运算 符 


语言 让 语句 的 简单 用 法 ， 用 大 于 


等 于 关系 运算 符 >= 执行 测试 。 程 序 输入 整 型 变量 num 的 
值 ， 然 后 把 它 和 整数 常量 limit 进行 比较 ， 如 果 num 的 值 大 于 等 于 limit 的 值 (100 )， 则 输 
出 单词 high， 否则 输出 low. WA else 部 分 的 证 语句 是 合法 的 。 





#include <stdio.h> 


int main() { 


const int limit = 100; 
int num; 
scanf ("%d", &num) ; 


if (num >= limit) { 
printf ("high\n") ; 
} 


else { 


printf ("low\n") ; 


} 


return 0; 


图 2-10 C 语言 的 论语 名 


可 以 用 图 2-11 所 示 的 布尔 运算 符 把 数 个 关系 测试 结合 起 来 。 两 个 信号 (&&) HAND 


运算 符 ， 两 个 竖 线 (||) 是 OR 运算 符 ， 惊 叹 号 ( ! 
aay ey 





! NOT 


图 2-11 布尔 运算 符 


如 果 age (ÆHF), income (收入 ) 和 tax( 缴 税 ) 是 整 型 变量 if 语句 


#2% C 4 


if ((age < 21) && (income <= 4000)) { 
tax = 0; 


} 


表示 : 如 果 年 龄 小 于 21 且 收 入 少 于 $4000， 则 缴 税 值 设置 为 0。 E 
图 2-10 的 证 语句 中 ， 每 个 选择 只 有 一 条 语句 。 如 果 在 一 个 选择 中 需要 执行 多 于 一 条 语 
句 ， 那 就 必须 用 花 括号 {} 把 这 些 语句 括 起 来 ， 和 否则 括号 是 可 选 的 。 
图 2-10 中 的 证 语句 可 以 这 样 写 : 
if (num >= limit) 
printf ("high\n") ; 
else 


printf ("low\n") ; 


输出 语句 不 用 花 括 号 括 起 来 。 = 


2.2.2 switch 语句 


图 2-12 中 的 程序 使 用 C 89 switch 语句 和 用 户 玩 一 个 竞猜 小 游戏 ， 要 求 用 户 挑 一 个 数 
字 ， 然 后 根据 输入 的 数字 输出 相应 的 消息 。 


#include <stdio.h> 


int main() { 


int guess; 

printf ("Pick a number 0..3: "); 

scanf("%d", &quess) ; 

switch (guess) { 
case 0: printf("Not close\n"); break; 
case 1: printf ("Close\n'"); break; 
case 2: printf ("Right on\n"); break; 
case 3: printf ("Too high\n") ; 

} 

return 0; 


} 
交互 式 输入 / 输出 


Pick a number 0..3: 1 
Close 





图 2-12 Cif BBY switch 语句 


用 让 语句 也 可 以 获得 和 switch 语句 相同 的 结果 ， 然 而 等 价 的 让 语 句 不 如 switch 语句 效 
率 高 。 
图 2-12 中 的 switch 语句 可 以 用 逻辑 上 等 价 的 嵌 套 的 证 语句 写 为 
if (guess == 0) { 
printf ("Not close\n") ; 
} 
else if (guess == 1) { 
printf ("Close\n"); 


44 xD GAERA (ROA) 


} 

else if (guess == 2) { 
printf ("Right onn"); 

} 

else if (guess == 3) { 
printf ("Too high\n") ; 


} 


然而 ， 这 段 代码 不 如 switch 语句 效率 高 。 使 用 这 段 代码 ， 如 果 用 户 猜 3， 那么 所 有 4 个 
测试 都 要 执行 。 使 用 switch 语句 ， 如 果 用 户 猜 3， 程序 直接 跳 到 "Too high" 语句 ， 而 不 必用 
0、1 和 2 与 guess 比较 。 = 


2.2.3 while 循环 


图 2-13 的 程序 输入 一 个 以 星 号 “*” 结 尾 的 字 
符 序 列 ， 输 出 除 星 号 以 外 的 全 部 字符 ， 且 一 个 单词 
占 一 行 。 有 经 验 的 C 语言 程序 员 不 会 用 星 号 作为 
标记 字符 (sentinel character)， 因 此 这 个 例子 没有 int maint) { 
实际 意义 。 图 2-13 和 本 章 中 所 有 的 程序 都 是 为 了 mat ph pode keni r 


#include <stdio.h> 


char letter; 


while (letter != '*') { 
在 后 面 的 章节 中 能 够 对 它们 在 更 低 的 抽象 层次 上 进 if (letter == ' ') { 
行 分 析 。 printf ("\n"); 
在 进入 循环 前 ， 程 序 给 全 局 变量 letter 输入 第 Aai 
一 个 字符 的 值 。 语句 printf (ue; letter); 


} 


scanf ("%c", &letter); 


while (letter != '*') 


将 letter 的 值 和 星 号 字符 进行 比较 。 如 果 它 们 不 相 

等 ， 那 么 执行 循环 体 ， 输 出 这 个 字符 ,或 者 男 起 一 

行 ， 然 后 输入 下 一 个 字符 。 接 着 ， 控 制 流 返回 到 循 

环 顶 部 的 条 件 判断 。 Hello, world!* 
如 果 letter 是 局 部 变量 而 不 是 全 局 变量 ， 那 么 wi 

程序 的 输出 还 是 一 样 。 把 变量 声明 为 全 局 的 还 是 局 二 

部 的 是 一 个 软件 设计 问题 。 经 验 法 则 是 : 总 是 把 变 seul 

量 声明 为 局 部 变量 ， 除 非 有 很 好 的 原因 不 这 么 做 。 

局 部 变量 能 增强 软件 系统 的 模块 性 ， 让 长 程序 更 容 图 2-13 CRE while wast 

易 阅 读 和 调试 。 图 2-4 和 图 2-13 中 的 全 局 变量 不 

代表 好 的 软件 设计 。 以 这 种 方式 呈现 是 为 了 说 明 C 的 内 存 模型 。 后 面 的 章节 会 展示 C 编译 

器 怎样 翻译 本 章 中 给 出 的 程序 。 


2.2.4 do 循环 

图 2-14 中 的 程序 说 明了 do 语句 的 使 用 。 这 个 程序 比较 特殊 ， 因 为 它 没 有 输入 ， 每 次 程 
序 执行 都 生成 同样 的 结果 。 这 也 是 一 个 没有 实际 意义 的 程序 ， 只 是 为 了 说 明 控 制 流 。 

一 个 警官 的 初始 位 置 在 0 单位 处 ， 然 后 开始 追 一 个 初始 位 置 在 40 单位 的 司机 。 每 执行 


输入 
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循环 体 一 次 代表 一 个 时 间 间 隔 ， 在 此 期 间 ， 和 警官 行进 25 个 单位 ， 司 机 行进 20 个 单位 。 语 名 


cop += 25; 
是 C 中 语句 #include <stdio.h> 

cop = cop + 25; int cop; 
的 缩写 形式 。 int driver; 

与 图 2-13 中 的 循环 不 一 样 ，do 语句 是 
在 循环 的 底部 进行 测试 ， 因 此 循环 体能 保证 aoe a es 
至 少 被 执行 一 次 。 当 语句 do { 

while (cop < driver); edie en 
执行 时 ， 它 比较 cop 的 值 和 driver 的 值 。 如 } 
果 cop 小 于 driver， 则 控制 流转 到 do， 于 是 ee E A 

printf ("%d", cop); 

循环 体重 复 。 return 0; 


2.2.5 数组 和 for 循环 
图 2-15 中 的 程序 用 来 说 明 for 循环 和 数 
组 。 程序 分 配 了 一 个 4 个 整数 的 局 部 数组 ， 
把 值 输入 数组 ， 然 后 以 相反 的 顺序 输出 值 。 
语句 


int Vector [4] ; 





图 2-14 C 语言 的 do 循环 


#include <stdio.h> 


int vector [4]; 
声明 变量 vector， 该 变量 是 一 个 由 4 个 整数 int. Ji 
组 成 的 数组 。 在 C 中 ,所 有 数组 的 第 一 个 索 int main() { 


引 都 是 0。 因 此 ， 这 个 声明 为 数组 元 素 nee I a Pe ts hy TNE A 
scanf ("%d", &vector[j]); 
vector [0] vector[1] vector[2] vector [3] } 
i for (j = 3; j >= 0; j--) { 
分 配 存储 空间 o printf ("td tain", ja vector[j]); 


声明 中 的 数字 指定 要 分 配 多 少 个 元 素 ， } 

它 总 是 比 最 后 一 个 元 素 的 索引 大 1。 在 这 个 — Hy 
程序 中 ， 元 素 个 数 是 4， 比 最 后 一 个 元 素 的 
索引 3 大 1。 

每 个 for 语句 都 有 一 对 圆 括 号 ， 它 里 面 
分 为 3 个 部 分 ， 各 部 分 之 间 用 分 号 隔 开 。 第 
一 个 部 分 赋 初 值 ， 第 二 个 部 分 是 测试 ， 第 
三 个 部 分 是 递增 。 在 这 个 程序 中 ， 对 于 for 
语句 


for (j = 0; j < 4; j++) 


j=0 是 赋 初 值 ，j<4 是 测试 ，j++ 是 递增 。 
当 程序 进入 循环 时 ，j 设置 为 0， 因为 测试 在 循环 的 顶部 ， 所 以 j 的 值 和 4 进行 比较 。 由 
于 j 小 于 4， 所 以 循环 体 





图 2-15 C 语言 的 数组 和 for 循环 
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scanf ("%d", &vector[j]); 


执行 。 输 入 流 中 的 第 一 个 整数 值 被 读 和 人 vector[0]。 控 制 返回 到 for 语句 ， 因 为 第 三 个 部 分 的 
表达 式 是 j++， 所 以 j 递增 1。 接 着 j 的 值 和 4 比较 ， 重 复 处 理 过 程 。 


递减 表达 式 


j-- 


是 C 中 j=j-1 的 缩写 ， 所 以 第 二 个 循环 是 以 相反 的 顺序 打印 值 。 
图 2-15 中 for 循 环 的 编程 风格 不 是 C 语言 的 首选 。 控 制 变量 j 很 少 被 声明 为 全 局 变量 。 


相反 ， 它 会 包含 在 for 语 句 的 范围 内 ， 
第 一 部 分 将 被 写 为 

for (int j = 0; j < 4; j++) 

为 了 更 好 地 讲解 运行 时 栈 上 的 全 局 
和 局 部 变量 分 配 ， 本 书 没有 使 用 首选 的 
编码 风格 。 如 果 采 用 首选 风格 ， 其 分 配 
过 程 描述 起 来 会 复杂 很 多 。 


2.3 AH 


C 有 两 种 函数 : 一 种 返回 值 为 空 ， 
男 一 种 返回 值 为 非 空 类 型 。 函 数 main() 
返回 整 型 ,不 是 空 值 。 操 作 系 统 根据 这 
个 整数 来 确定 程序 是 否 正常 结束 。 返 回 
值 为 空 的 函数 完成 处 理 ， 不 返回 任何 值 。 
这 种 函数 也 被 称 为 过 程 (procedure)。 返 
回 值 为 空 的 函数 的 常见 用 法 是 输入 或 输 
出 一 组 值 。 


2.3.1 空 函 数 和 传 值 调用 的 参数 


图 2-16 中 的 程序 使 用 空 函数 打印 
一 个 数值 的 柱状 图 。 程 序 把 第 一 个 值 读 
人 整 型 变量 numPts。 在 主 程序 中 ， 全 
局 变量 j 控 制 for 循 环 执行 numPts 次 。 
每 次 执行 循环 都 调用 空 函 数 printBar()。 
图 2-17 展示 了 图 2-16 中 程序 开始 执行 
时 的 跟踪 记录 。 

当 调 用 一 个 空 函数 时 ， 运 行 时 栈 中 
的 分 配 按 照 以 下 顺序 进行 : 

e 压 入 实际 参数 。 

e 压 入 返回 地 址 。 

e 压 人 局 部 变量 的 存储 空间 。 





#include <stdio.h> 


int numPts; 
int value; 
int ji; 
void printBar(int n) { 
int k; 
for (k = 1; K <= n; k+) { 
printf ("*") ; 
} 
print£("\n"); 


} 


int main() { 
scanf("%d", &numPts) ; 
for (j = 1; j <= numPts; j++) { 
scanf("%d", &value); 
printBar (value) ; 
//ral 


} 


return 0; 


13 17 34 27 23 25 29 16 10 0 2 
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** 


图 2-16 打印 柱状 图 的 程序 。 该 空 函数 打印 一 个 柱 形 








numPoints numPoints 
value retAddr value retAddr 
j retVal j nmn: retVal 
a) 开始 时 b) scanf("%d", &numPts) 
numPoints = numPoints 
value retAddr value | ra0 | retAddr 
j retVal j mar retVal 
c)for(j = 1; j <= numPoints; j++) d)scanf("%d", &value) 







retAddr 


numPoints n 


numPoints 


j 


value retAddr 


3 retVal 


f) 压 入 返回 地 址 





numPoints 
value retAddr 


retVal 





g) 压 人 局 部 变量 k 的 存储 空间 
图 2-17 图 2-16 所 示 程 序 的 运行 时 栈 


非 空 函数 的 分 配 过 程 与 之 相同 ,但 是 没有 初始 时 压 入 返回 值 的 存储 空间 这 一 步 。 形 式 参 
数 (简称 形 参 ) 是 函数 声明 中 的 参数 。 图 2-16 中 , n 是 形 参 。 实 际 参 数 (简称 实 参 ) 是 函数 
调用 中 的 参数 。 图 2-16 中 ，value 是 实 参 。 

图 2-17e 是 图 2-16 所 示 程 序 分 配 过 程 的 开始 ， 程 序 压 人 形 参 n 对 应 的 实 参 value 的 值 ， 
结果 就 是 形 参 n 得 到 了 实 参 value 的 值 。 在 图 2-17f 中， 压 人 返回 地 址 。 图 2-17g 中 压 人 局 
部 变量 k 的 存储 空间 。 分 配 过 程 完成 后 ， 列 表 中 的 最 后 一 个 局 部 变量 k 在 栈 的 顶部 。 

被 压 人 运行 时 栈 的 所 有 项 目的 集合 称 为 栈 帧 (stack frame) 或 活跃 记录 (activation 
record)。 在 图 2-16 的 程序 中 ,该 空 函数 的 栈 帧 由 3 项 组 成 : n、 返 回 地 址 和 k。 图 中 用 ral 
标识 的 返回 地 址 是 主 程序 中 for 语句 结束 处 的 地 址 。main() 函数 的 栈 帧 由 两 项 组 成 : 返回 值 
和 返回 地 址 。 

该 过 程 打印 柱状 图 的 一 根 柱 子 后 ， 控 制 返回 到 主 程序 。 运 行 时 栈 上 的 项 目 按照 与 分 配 顺 
序 相反 的 顺序 进行 释放 。 步 又 如 下 : 

e 弹出 局 部 变量 

e 弹出 返回 地 址 ， 并 用 其 确定 下 一 条 要 执行 的 指令 

o 弹出 参数 
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程序 通过 返回 地 址 知道 ， 在 执行 完 空 函数 的 最 后 一 条 语句 后 ， 接 下 来 去 执行 主 程序 中 的 
哪 条 语句 。 在 主 程序 代码 中 ， 返 回 地 址 ral 标识 的 那 条 语句 ， 是 过 程 调用 后 面 的 一 条 语句 。 
它 表 示 的 是 ， 在 分 文 返回 到 循环 项 端的 测试 之 前 ，j 执行 递增 的 地 方 。 

2.3.2 ”函数 的 例子 


图 2-18 中 的 程序 用 函数 计算 一 个 整数 的 阶乘 值 。 程 序 提示 用 户 输入 一 个 小 的 整数 ， 把 
它 作为 参数 传递 给 函数 fact()。 


#include <stdio.h> 
int num; 


int fact(int n) { 


an Ep Jẹ 

£ = Ds 

for (j = 1; j <= n; j++) { 
E t= J? 

} 

return f; 


} 


int main() { 
printf ("Enter a small integer: "); 
scanf ("%d", &num) ; 
printf("Its factorial is: d\n", fact(num)); // ral 
return 0; 


} 
交互 式 输入 /输出 


Enter a small integer: 3 
Its factorial is: 6 





图 2-18 用 函数 计算 整数 阶乘 的 程序 


图 2-19 展示 了 图 2-18 中 函数 的 分 配 过 程 ， 该 函数 返回 实 参 的 阶乘 。 图 2-19c 表明 首先 
压 入 的 返回 值 的 存储 空间 。 图 2-19d 展示 压 人 的 形 参 n 对 应 的 实 参 num 的 值 了 。 图 2-19e 中 
压 人 返回 地 址 。 图 2-19f 和 g 压 和 局 部 变量 f 和 j 的 存储 空间 。 

这 个 函数 的 栈 帧 有 5 项。 图 中 标记 为 ral 的 返回 地 址 表示 主 程序 中 printf() 函数 调用 的 
地 址 。 控 制 从 该 函数 返回 到 调用 该 函数 的 语句 。 这 与 空 函 数 是 不 同 的 ， 在 空 函数 的 调用 中 ， 
控制 是 返回 调用 语句 后 面 的 那 条 语句 。 


2.3.3 传 引 用 调用 的 参数 


前 面 讲述 的 程序 中 的 过 程 和 函数 都 是 通过 值 传递 参数 的 。 在 传 值 调用 中 ， 形 参 获得 实 参 
的 值 。 如 果 被 调用 的 过 程 改变 了 它 的 形 参 值 ， 调 用 程序 中 相应 的 实 参 值 不 变 。 被 调用 过 程 所 
做 的 任何 改变 都 是 对 运行 时 栈 上 的 值 进行 的 ， 当 栈 帧 释放 后 ， 任 何 被 改变 的 值 也 随 之 释放 。 

如 果 一 个 过 程 意 在 改变 调用 程序 中 实 参 的 值 ， 那 么 就 要 使 用 传 引用 调用 而 不 是 传 值 调 
用 。 在 传 引用 调用 中 ,， 形 参 获得 的 是 对 实 参 的 一 个 引用 。 如 果 被 调用 过 程 改 变 了 其 形 参 的 
值 ， 那 么 调用 程序 中 相应 的 实 参 也 会 改变 。 要 指定 一 个 参数 为 传 引用 调用 ， 要 用 地 址 运算 符 


久 来 传递 实 参 的 地 址 。 相 应 的 形 参 是 一 个 指针 ， 


地 址 。 


retAddr 
num [| i | retVal 
4 


a) 开始 时 







retVal 
retAddr 
retVal 


retAddr 
retVal 





retVal 






retAddr 


retVal 


g) 压 人 局 部 变量 j 的 存储 空间 
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必须 加 前 缀 符号 *。 在 C 语言 中 ， 指 针 即 


| rad | retAddr 
ms retVal 
Os 


b)scanf("%d", &num) 








n 
retVal 
retAddr 
retVal 


retAddr 
n 
retval 
retAddr 
retVal 





j 
£ 






retAddr 
n 
retVal 
retAddr 


num retVal 


四 


h)f = 1 


FA 2-19 图 2-18 所 示 程 序 的 运行 时 栈 


图 2-20 中 的 程序 用 传 引用 调用 改变 main) 中 实 参 的 值 。 它 提示 用 户 输入 两 个 整数 并 对 
它们 排序 。 它 用 一 个 空 函 数 order() 来 调用 另 一 个 空 卫 数 swap()。 在 main() 中 ， 对 order() 的 
调用 以 &a 为 实 参 ， 以 *x 为 相应 的 形 参 。 x 是 一 个 指针 ， 因 此 ， 也 是 一 个 地 址 。 换 句 话说， 
x EXS a 的 地 址 。 当 order() 调用 swap() 时 ， 实 参 必须 是 一 个 地 址 。 由 于 x 已 经 是 地 址 了 ， 
所 以 在 order() 调用 的 实 参 列表 中 不 用 在 它 的 前 面 加 上 地 址 运算 符 &。 

过 程 order() 展示 了 如 何 访问 被 指向 单元 的 值 。 诺 语句 的 测试 如 下 : 


if (*x > *y) 


由 于 x 是 一 个 指针 , *x 是 x 指 向 的 存储 单元 的 值 ， 所 以 ， 变 量 x 是 一 个 指向 int 的 指针 ， 
表达 式 *x 是 一 个 int。 同 样 ，*y 是 y 指向 的 存储 单元 的 值 。 测 试 


if (x > y) 
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#include <stdio.h> 
int a, b; 


void swap(int *r, int *s) { 
int temp; 
temp = *r; 
*y tS; 
*s temp; 


} 


void order(int *x, int *y) { 
if (*x > *y) { 
swap (x, y); 
} // ra2 
} 


int main() { 
printf ("Enter an integer: " 
scanf ("%d", &a) ; 
printf ("Enter an integer: " 
scanf ("td", &b); 
order (&a, &b); 
printf ("Ordered they are: $d, td\n", a, b); // ral 
return 0; 


} 

交互 式 输入 / 输出 

Enter an integer: 6 
Enter an integer: 2 
Ordered they are: 2, 6 





图 2-20 ”对 两 个 数 排序 的 程序 。 空 函数 用 传 引 用 方式 传递 参数 


将 会 出 错 ， 因 为 它 测 试 的 是 a 的 地 址 是 否 大 于 b 的 地 址 ， 而 不 是 a 是 否 大 于 b。 
过 程 swap() 也 展示 了 运算 符 * 如 何 对 指针 解 引用 。 在 参数 列表 中 ， 形 参 


int *r 
表示 fr 是 一 个 指向 整数 的 指针 。 也 就 是 说 , r 是 一 个 整数 的 地 址 。 对 赋值 语句 

temp = *r; 
星 号 * 对 r 解 引用 。 因 为 + 是 指向 整数 的 指针 ，*r 是 其 指向 的 整数 ， 所 以 赋值 语句 把 整数 值 
*r 赋 给 整数 变量 temp. 


图 2-21 展示 了 整个 程序 的 分 配 和 释放 的 顺序 。 图 2-21c 中 order() 的 栈 帧 有 3 项 。 形 参 
x 和 y 是 传 引用 调用 的 ， 有 箭头 从 运行 时 栈 上 的 x 指向 主 程序 中 的 a， 这 表明 x 引用 a。 也 
就 是 说 ,x 是 a 的 地 址 。 类 似 地 ， 从 y 指向 b 的 箭头 表明 y 引 用 b。ral 标识 的 返回 地 址 是 
printf() 语句 的 地 址 ， 该 语句 在 主 程序 中 位 于 对 order() 的 调用 之 后 。 

图 2-21d 中 swap 的 栈 帧 有 4 项 。r 引 用 x，x 引用 a， 因 此 r 引 用 a。 箭 头 从 运行 时 栈 上 
的 r 指 到 a， 箭 头 同 样 从 x 指向 a。 类 似 地 ， 箭 头 从 运行 时 栈 上 的 s 指向 b， 箭 头 同 样 从 y 指 
向 b。ra2 标识 的 返回 地 址 是 函数 order) 最 后 一 条 语句 的 地 址 。swap() 中 的 语句 交换 s 和 上 

的 值 。 因 为 r 引 用 a，s 引用 b， 所 以 它们 交换 的 是 主 程序 中 a 和 的 值 。 


2# C Si 
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a) 开始 时 
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c)order(&a, &b) d) swap (x,y) 












retAddr 


Y 
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retAddr b | 6 | | ra0 | retAddr 
retVal a | retval 
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e) Mswap () 返回 f) Morder () i& [Al 
图 2-21 图 2-20 的 运算 时 栈 


当空 函数 结束 时 ， 要 释放 它 的 栈 帧 ， 栈 帧 中 的 返回 地 址 告诉 计算 机 接 下 来 去 执行 哪 条 指 
令 。 图 2-21e 展示 了 从 空 函 数 swap 返回 的 过 程 ， 释 放 其 栈 帧 。swap 栈 帧 中 的 返回 地 址 告诉 
计算 机 在 释放 该 栈 帧 之 后 顺序 执行 order() 中 标号 为 ra2 的 语句 。 虽 然 图 2-20 中 的 代码 ra2 
处 并 没有 语句 ,但 是 空 函 数 结尾 处 隐 含 有 一 个 return 语句 ， 这 在 HOL6 层 是 不 可 见 的 。 

图 2-21f 展示 了 释放 order) 栈 帧 的 过 程 。order0) 栈 帧 中 的 返回 地 址 告诉 计算 机 在 释放 
该 栈 帧 之 后 ， 执 行 主 程序 中 的 printf) 函数 。 

因为 栈 是 LIFO 结构 ， 所 以 在 函数 结束 时 ， 最 后 一 个 被 压 入 运行 时 栈 的 栈 帧 将 第 一 个 被 
弹出 。 因 此 返回 地 址 将 把 控制 返回 到 最 近 的 调用 函数 。 运 行 时 栈 的 LIFO 属性 将 是 理解 2.4 
节 中 递归 的 基础 。 

你 可 能 已 经 注意 到 了 ，main() 函数 总 是 返回 整数 ， 并 且 当 前 给 出 的 所 有 程序 都 向 操作 
系统 返回 0。 此外， 截至 目前 ， 所 有 的 主 程序 函数 都 没有 参数 。 虽 然 主 程序 有 参数 是 很 常 
见 的 ,但 是 本 书 中 的 主 程序 都 没有 。 为 了 保持 图 的 简单 性 ， 后面 的 图 中 都 将 省 略 主 程序 的 
retVal 和 retAddr。 实 际 的 C 编译 器 则 必须 处 理 这 两 者 。 


24 递归 


你 曾 在 字典 中 查找 不 认识 单词 的 定义 时 ， 发 现 字 典 恰恰 是 以 另 一 个 不 认识 的 单词 来 定义 
它 的 吗 ? 接着 你 就 查找 第 二 个 单词 ， 发 现 它 是 用 第 一 个 单词 来 定义 的 吗 ? 这 是 一 个 循环 或 间 
接 递归 的 例子 。 字 典 的 这 个 问题 源 于 从 一 开始 你 就 不 知道 第 一 个 单词 的 意思 。 如 果 第 二 个 单 
词 用 你 认识 的 第 三 个 单词 来 定义 ， 就 能 得 到 满意 的 结果 了 。 

HFE, eR ia Æ XL (recursive definition) 是 指 函 数 使 用 其 自身 来 定义 自己 。 例 
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Wn, BERRAR fin) 定义 如 下 : 
S(n)=nf(n-1) 
BARR TE OR AE (4), PETER LPH 44 n: 
f(4)=4 x f(3) 
但 是 现在 你 不 知道 3) 是 什么 ， 那么 在 定义 中 用 3 RE n, 18: 
f(3)=3 Xf(2) 
把 这 个 代 进 M4) 的 公式 中 ， 得 到 : 
/(4)=4 x 3 Xf(2) 
但 是 ， 现 在 你 不 知道 2) 是 什么 ， 定 义 告诉 你 它 是 2 乘 以 (1)， BARAH 的 公式 变 为 
J/(4)=4x3x2x/0) 
可 以 看 到 这 个 定义 的 问题 : 没有 什么 能 够 结束 这 个 过 程 ， 你 将 无 穷尽 地 计算 ft4)。 
J(4)=4X3X2X0X(-1)X(-2) X (-3)... 

这 就 如 同 字典 给 了 你 一 个 无 穷尽 的 定义 串 一 样 ， 每 个 单词 都 基于 另 一 个 你 不 认识 的 单 
i], AWM, ERMA MRE nH fn) 值 ， 那 么 前 述 过 程 就 能 终止 ， 你 可 以 计算 出 
IET n ÉY fin). 

下 面 是 fin) 的 一 个 完整 递归 定义 : 


Holley Ta 


这 个 定义 说 明 前 述 过 程 可 以 在 ft1) PEE, $C) 被 称 为 基础 (basis), Alt, A4) 是 
SAX f(A) 
=4X 3 X f(2) 
=4X3X2Xf(1) 
=4X3X2X1 
=24 
你 应 该 知道 这 就 是 阶乘 函数 的 定义 。 


2.4.1 阶乘 函数 


C 语言 中 的 递归 函数 (recursive function) 是 调用 它 自己 的 函数 。 没 有 什么 用 新 语法 的 特 
殊 递归 语句 需要 学 习 。 它 在 运行 时 栈 上 分 配 存储 空间 的 方法 和 非 递 归 函 数 是 一 样 的。 唯一 的 
不 同 是 递归 函数 包括 一 条 调用 它 自己 的 语句 。 

2-22 中 的 函数 递归 地 计算 一 个 数 的 阶乘 ， 它 是 ftn) 递归 定义 的 一 个 直接 应 用 。 

2-23 给 出 了 简化 的 该 程序 运行 时 栈 的 跟踪 记录 ， 它 隐藏 了 主 程序 的 栈 帧 。 第 一 个 函 
数 调用 来 自主 程序 。 图 2-23c 展示 了 第 一 次 调用 的 栈 帧 ， 假 设 用 户 输 入 为 4。 返 回 地 址 是 
ral ， 它 代表 主 程序 中 printf() 函数 的 地 址 。 

该 函数 中 第 一 条 语句 测试 n 是 否 为 1。 因 为 n 的 值 是 4， 所 以 执行 else 部 分 。 而 else 部 
分 的 语句 


return n * fact(n - 1) // ra2 


在 返回 语句 的 右边 包含 一 个 对 函数 fact() 的 调用 。 


#include <stdio.h> 
int num; 


int fact(int n) { 
if (n <= 1) { 
return 1; 
} 
else { 
return n * fact(n - 1); // ra2 
} 
} 


int main() { 


printf ("Enter a small integer: "); 

scanf ("%d", &mum); 

printf ("Its factorial is: %d\n", fact(num)); // ral 
return 0; 


} 
交互 式 输入 /输出 


Enter a small integer: 4 
Its factorial is: 24 








图 2-22 ”递归 计算 阶乘 的 函数 


这 是 一 个 递归 调用 ， 因 为 它 在 函数 里 调用 它 自 己 。 这 个 调用 和 任何 其 他 函数 调用 的 事件 
序列 是 一 样 的 。 分 配 新 的 栈 帧 ， 如 图 2-23d 所 示 。 第 二 个 栈 帧 中 的 返回 地 址 是 这 个 函数 中 调 
用 语句 的 地 址 ， 由 ra2 来 表示 。 

实 参 是 n-1， 由 于 图 2-23c n 的 值 是 4， 所 以 它 的 值 是 3。 形 参 n 是 传 值 调用 的 ， 因 
此 图 2-23d 顶部 栈 帧 的 形 参 n 赋值 为 3。 

图 2-23d 展示 了 一 个 对 递归 调用 来 说 很 典型 的 奇特 现象 。 图 2-22 的 程序 代码 中 函数 fact 
的 形 参 表 中 只 声明 了 一 个 n, 但 图 2-23d H n 出现 了 两 次 。n 的 旧 实 例 从 主 程序 中 获得 值 4， 
mi n 的 新 实例 从 递归 调用 中 获得 值 3。 

计算 机 暂停 该 函数 的 旧 执 行 ， 并 从 头 开 始 该 函数 的 一 个 新 执行 。 该 函数 的 第 一 条 语句 是 
比较 n 是 否 等 于 1， 图 2-23d 中 在 运行 时 栈 上 有 两 个 n， 应 该 比较 哪个 n 呢 ”规则 是 : 任何 对 
局 部 变量 或 形 参 的 引用 指 的 都 是 顶部 栈 帧 中 的 那个 。 因 为 n 的 值 是 3， 所 以 执行 else 部 分 。 

但 是 现在 函数 又 进行 一 次 递归 调用 ， 分 配 第 三 个 栈 帧 ， 如 图 2-23e 所 示 ， 接 着 是 第 四 
个 ， 如 图 2-23f 所 示 。 每 次 调用 ， 最 新 分 配 的 形 参 n 的 值 都 比 旧 值 小 1， 因为 函数 调用 是 


fact(n - 1) 


最 后 ， 如 图 2-23g 所 示 ，n 的 值 为 1 。 该 函数 给 栈 上 标号 为 retVal 的 单元 赋值 为 1， 跳 
过 else 部 分 ， 然 后 终止 。 这 使 得 控制 返回 到 它 的 调用 语句 。 

递归 返回 的 事件 和 非 递归 返回 是 一 样 的 。retVal 包含 返回 值 ， 返 回 地 址 说 明 接 下 来 要 执 
行 哪 条 语句 。 图 2-23g 中 ，retVal 是 1， 返回 地 址 是 该 函数 中 的 调用 语句 。 释 放 顶 部 栈 帧 ， 
调用 语句 


return n * fact(n - 1) // ra2 


完成 它 的 执行 。 该 语句 将 n 的 值 2 乘 以 返回 值 1， 并 把 这 个 乘积 赋 给 retVal。 这 样 retVal 的 
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值 就 是 2， 如 图 2-23h 所 示 。 


non] 


VILTTTTTTT1 [TTT 
a) 开始 时 b)scanf("%d", &num) 





















retval 
retAddr retAddr 
n n 
retVal retVal 
retAddr retAddr retAddr 
n n n 
retval retVal retVal 


retAddr retAddr retAddr 


d) 调用 fact(3) e) 调用 fact(2) f) 调用 fact(1) 


retAddr 


retVal 
retAddr 


retVal 






retAddr retAddr 


retVal 
retAddr 


retVal 
retAddr 





g) 计算 retval i) 返回 
| ral | retAddr 
EZ, 
num Ea retVal 
Ls] 
j ) 返回 k) 返回 


图 2-23 2-22 的 运行 时 栈 


每 次 返回 都 执行 同样 的 事件 序列 。 图 2-23i、j 展示 了 从 第 二 次 调用 返回 的 值 是 6， 而 第 
一 次 调用 返回 的 值 是 24。 图 2-24 展示 了 图 2-22 程序 的 调用 序列 。 主 程序 调用 函数 fact， 接 
着 函数 fact 调用 它 自己 3 Ks KAF, RZ fact 总 共 被 调用 了 4 次 。 

你 可 以 看 到 ， 程 序 计算 4 的 阶乘 的 方法 与 从 它 的 递归 定义 计算 4) 的 方法 一 样 。 计 算 
AA) NWA 4 FEV 3) 开始 ， 接 着 必须 暂停 计算 ft4)， 转 而 计算 3)。 在 得 到 ft3) 的 值 之 后 ， 用 4 


FEW EMSA (4). 
类 似 地 ， 程 序 必须 暂停 对 该 函数 的 一 次 执行 ， 
再 次 调用 同一 个 函数 。 运 行 时 栈 跟踪 记录 变量 的 当 
前 值 ， 这 样 当 函数 实例 再 继续 时 ， 还 能 使 用 正确 的 424 
AR fact (4) 
变量 值 。 et 
2.4.2 递归 的 思考 方式 
有 两 种 不 同 的 角度 来 看 待 递归 : 微观 的 和 宏观 Ce 
的 。 图 2-23 是 从 微观 的 角度 展示 的 ， 精 确 地 给 出 了 td 
执行 期 间 计算 机 内 发 生 了 什么 。 它 考虑 的 是 程序 跟 
踪 记 录 中 运行 时 栈 的 细节 。 宏 观 的 看 法 不 考虑 单独 asd Be eT, SAAR 84 
的 每 棵 树 ， 它 考虑 的 是 整个 森林 。 示 函 数 调用 ， 虚 箭头 表示 返回 ， | 85 
为 了 理解 C 怎样 实现 递归 ， 需 要 了 解 微观 的 角 每 个 返回 箭头 旁边 的 是 返回 值 
度 。 在 学 习 Asmb5 层 怎 样 实现 递归 时 ， 必 须 了 解 运 


行 时 栈 的 细节 。 如 果 只 是 想 写 递归 函数 ， 应 该 宏观 而 不 是 微观 地 思考 。 


栈 ， 


写 递归 函数 最 难 的 地 方 是 ， 必 须 假设 可 以 调用 正在 写 的 过 程 。 为 此 ， 你 必须 忘掉 运行 时 
宏观 地 思考 。 
数学 归纳 法 证 明 有 助 于 进行 宏观 思考 。 归 纳 法 证 明 的 两 个 关键 元 素 是 : 
o 建立 基础 。 
e Ae n 的 公式 ,证 明 它 对 n+l 是 成 立 的 。 
同样 ， 设 计 递 归 函 数 的 两 个 关键 元 素 是 : 
o 计算 该 函数 的 基础 。 
e BRA n-1 的 函数 ， 写 出 n 的 函数 。 
想象 你 正在 写 函 数 fact()， 写 到 了 这 里 : 
int fact(int n) { 
if (n <= 1) { 


return 1; 


} 


else { 


不 知 该 怎样 写 下 去 了 。 你 已 经 计算 了 n=1 时 的 基础 函数 ， 但 是 现在 必须 假设 能 调用 函数 
fact()， 尽 管 这 个 函数 还 没有 写 完 。 必 须 假设 fact(n—1) 将 返回 阶乘 的 正确 值 。 


这 里 是 必须 宏观 思考 的 地 方 。 如 果 开 始 想 知 道 fact(n—1) 怎样 返回 正确 值 ， 并 且 栈 帧 开 


始 在 你 脑 中 跳跃 ,那么 这 样 的 思考 是 不 对 的 。 在 归纳 法 证 明 中 ,必须 假设 有 n 的 公式 。 同 


样 ， 


在 写 函 数 fact( 时 ， 必 须 假设 能 毫 无 问题 地 调用 fact(n-1). 
递归 程序 是 基于 分 治 策略 的 ， 如 果 能 把 一 个 大 问题 分 解 为 小 问题 从 而 解决 它 ， 这 个 策略 


就 很 合适 。 每 次 递归 调用 都 使 问题 变 得 越 来 越 小 ， 直 到 程序 到 达 最 小 的 问题 ， 即 基础 ， 而 基 
础 问题 是 很 容易 解决 的 。 


2.4.3 ”递归 加 法 


这 里 有 递归 问题 的 另 一 个 例子 。 假 设 list 是 一 个 整数 数组 ， 想 要 递归 地 求 出 表 中 所 有 整 


数 的 和 。 

第 一 步 是 构想 出 以 较 小 问题 来 解决 大 问题 的 解决 方案 。 如 果 知 道 怎 样 求 出 list[0] 和 
list[n-1] 之 间 元 素 的 和 ， 简 单 地 把 这 个 和 加 上 list[n]， 就 能 得 到 所 有 整数 的 和 。 

第 二 步 是 设计 出 具有 适当 参数 的 函数 。 这 个 函数 通过 调用 它 自己 计算 n-1 个 整数 的 和 
来 计算 n 个 整数 的 和 。 因 此 参数 表 里 必 须 有 一 个 参数 指明 数组 中 有 多 少 个 整数 相 加 。 应 该 得 
到 如 下 的 函数 头 : 

int sum(int a[], int n) { 


// Returns the sum of the elements of a between a[0] 
and a[n]. 


怎样 建立 归纳 基础 呢 ?” 很 简单 ， 如 果 n 等 于 0， 那 么 函数 应 该 把 a[0] 和 a[0] 之 间 的 元 素 
求 和 ， 一 个 元 素 的 和 就 是 元 素 a[0]。 

现在 可 以 写 出 

if (n == 0) { 


return a[0]; 


} 


else { 


现在 ， 宏 观 地 思考 。 可 以 假设 sum(a,n—1) 将 返回 a[0] 和 afn-1] 之 间 所 有 整数 的 和 。 要 
有 信心 ! 需要 做 的 就 是 把 这 个 和 与 arn] 相 加 。 图 2-25 展示 了 已 完成 的 程序 中 的 这 个 函数 。 
#include <stdio.h> 


int list [4]; 


int sum(int a[], int n) { 


// Returns the sum of the elements of a between a[0] and a[n]. 
if (n == 0) { 
return a[0]; 
} 
else { 


return a[n] + sum(a, n - 


int main() { 
printf ("Enter four integers: "); 
scanf ("%d td %d yd", &list[0], &list[1], G&list[2], &list[3]); 
printf ("Their sum is: #d\n", sum(list, 3)); 
return 0; 


} 
交互 式 输入 /输出 


Enter four integers: 3 2 6 4 
Their sum is: 15 





图 2-25 返回 数组 中 前 n 个 数字 之 和 的 递归 函数 


尽管 写 这 个 函数 时 没有 从 微观 角度 进行 考虑 ， 但 是 仍然 可 以 跟踪 记录 运行 时 栈 。 图 2-26 
展示 了 对 sum 前 两 次 调用 的 栈 帧 。 栈 帧 由 返回 值 、 参 数 a 和 n 以 及 返回 地 址 组 成 。 因 为 这 
里 没有 局 部 变量 ， 所 以 运行 时 栈 上 也 没有 为 它们 分 配 存储 空间 。 





list [oll 3 | list [ol 3 | | ral | retadar ys et [olf 3 | ral | 

list [1]| 2 | list[1]| 2 | n list [1]| 2 | 

list [2]| 6 | list[2]| 6 | |. Ja list(2]] 6 | 

list[3]| 4 | list [3] 4 | | |retval list[3]| 4 | | [retval 
PPI 5 5 


a) 输入 list b) 调用 sum (list,3) c) 调用 sum (list ,2) 
图 2-26 图 2-25 中 程序 的 运行 时 栈 


在 C 语言 中 ， 数 组 总 是 传 引用 调用 的 ， 其 实 参 列 表 中 没有 地 址 运算 符 &。 图 2-25 的 调用 

sum(list, 3) 
H, EXS list 没有 使 用 前 缀 的 地 址 运算 符 &， 但 它 仍然 是 传 引 用 调用 。 因 此 ， 过 程 sum 中 
的 变量 a 引用 主 程序 中 的 list。 从 字面 上 看 ， 它 包含 了 数组 第 一 个 元 素 的 地 址 。 程 序 中 , a 包 
含 了 list[0] 的 地 址 。 图 2-26b 和 ec 中 有 箭头 从 栈 帧 中 标号 为 a 的 单元 指向 标号 为 list 的 单元 ， 
这 表示 a 引用 list。 

与 没有 索引 的 数组 名 称 相 反 ， 有 索引 的 数组 名 称 表 示 的 是 数组 中 的 单个 元 素 ， 应 将 其 视 
为 单个 变量 。 图 2-25 中 ，scanf() 调用 中 的 实 参 list[1] 使 用 了 前 级 地 址 运算 符 &， 这 样 就 能 
通过 传 引用 来 调用 它 。 总 而 言 之 ，list [1] 是 整数 类 型 ， 在 传 引用 调用 时 需要 地 址 运算 符 ; 而 
list 是 数组 类 型 ， 在 传 引用 调用 时 ， 默 认 情 况 下 不 需要 地 址 运算 符 。 


2.4.4 二 项 式 系数 函数 


递归 函数 的 下 一 个 例子 有 一 个 更 加 复杂 的 调用 序列 。 这 个 函数 计算 二 项 式 扩展 的 系数 。 
考虑 如 下 的 扩展 : 
(+y) =x+y 
(y) +H 
Cty) =r H3 y +3 +y 
aty =x HAr yt6x y Aay ty" 
这 些 项 的 系数 叫 作 二 项 式 系数 (binomial coefficient)。 如 果 不 带 项 只 写 出 这 些 系数 ， 
就 形成 一 个 由 数值 组 成 的 三 角 ， 称 为 帕斯卡 三 角 
( Pascal’s triangle)。 图 2-27 是 一 个 最 高 到 7 KEK 
数 的 帕斯卡 三 角 。 A 





b(n, k)=b(n-1, k)+b(n-1, k-1) 
它 是 一 个 递归 定义 ， 因 为 函数 b(n, k) 以 自己 定 
义 了 自己 。 也 可 以 看 到 ， 如 果 k 等 于 0 或 者 如 果 n 
ST k, 那么 二 项 式 系数 的 值 就 是 1。 完整 的 数学 定 
义 包 含 了 这 两 个 基础 情况 ， 其 表达 式 如 下 : 


IS 20 15 6 1 
21 33 35 21 7 1 


oO t 2s 4 S&S & F 
从 图 2-27 可 以 看 到 ， 每 个 系数 是 它 正 上 方 和 左 ~ — 
上 方 系数 的 和 。 例 如 ,5 行 2 列 的 二 项 式 系数 10 等 2 | 1 2 
于 4 加 6, 6 在 10 的 正 上 方 , 4 在 10 的 左上 方 。 3 L a 3 
n RF k MMRR b(n, 月 的 数学 表达 式 是 : 4 L 4 1 
5 1 5 %10 5 1 
6 1 6 
7 l 学 





图 2-27 二 项 式 系数 的 帕斯卡 三 角 
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1 k=0 
b(n,k)=4 1 n=k, 
b(n-1,k)+b(n-1,k-1) 0<k<n 


Al 2-28 是 递归 计算 二 项 式 系数 值 的 程序 。 该 程序 直接 建立 在 b(n, 月 的 递归 定义 之 上 。 

图 2-29 是 运行 时 栈 的 跟踪 记录 。 图 2-29b、c 和 d 展示 了 前 3 个 栈 帧 的 分 配 ， 分 别 代表 调用 

binCoeff(3,1), binCoeff(2,1) 和 binCoeff(1,1)。 第 一 个 栈 帧 的 返回 地 址 是 主 程序 中 的 调用 程 
序 ， 接 下 来 两 个 栈 帧 的 返回 地 址 是 yl 赋值 语句 ， 即 标号 为 ra2 的 那 条 语句 。 


#include <stdio.h> 


int binCoeff(int n, int k) { 
int yl, y2; 
if ((k == 0) || (a s= k)) { 
return 1; 
} 
else { 
yl = binCoeff(n = 1, k); // Ya2 
y2 = binCoeff(n - 1, k - 1); // ra3 
return yl + y2; 
} 
} 


int main() { 
printf ("binCoeff(3, 1) = %d\n", binCoeff (3, 1)); // ral 
return 0; 


输出 
binCoeff(3, 1) = 3 





图 2-28 二 项 式 系数 的 递归 计算 


图 2-29e 展示 了 从 binCoeff(1,1) 的 返回 ，y1 获得 函数 的 返回 值 1， 接 着 y2 赋值 语句 调 
用 函数 binCoeff(1,0)。 图 2-29f 展示 binCoeff(1,0) 执行 期 间 的 运行 时 栈 ， 每 个 栈 帧 都 有 不 同 
的 返回 地 址 。 

这 个 程序 的 调用 序列 不 同 于 前 面 那些 递归 程序 的 调用 序列 。 那 些 程序 是 不 断 分 配 栈 
帧 ， 直 到 运行 时 栈 达 到 最 大 高 度 ， 然 后 不 断 释 放 栈 帧 直到 运行 时 栈 为 空 。 这 个 程序 则 是 分 
配 运行 时 栈 达 到 最 大 高 度 ， 但 是 不 会 连续 释放 栈 帧 ， 直 到 运行 时 栈 为 空 。 从 图 2-29d 到 图 
2-29e 释放 栈 帧 ， 但 是 从 图 2-29e 到 图 2-29f 分 配 栈 帧 ; 从 图 2-29f 到 图 2-29g 到 图 2-29h 
又 释放 栈 帧 ， 而 从 图 2-29h 到 图 2-29i 又 分 配 栈 帧 。 为 什么 会 这 样 呢 ? 这 是 因为 这 个 函数 
有 两 个 递归 调用 而 不 是 一 个 。 如 果 基 础 判断 为 真 ， 那 么 函数 不 执行 递归 调用 ; 但 如 果 基 础 
判断 为 假 ， 则 函数 执行 两 个 递归 调用 ， 一 个 计算 yl1， 一 个 计算 y2。 图 2-30 展示 了 该 程序 
的 调用 序列 。 可 以 看 到 它 是 树 状 的 。 树 的 每 个 结 点 代表 一 个 函数 调用 。 除 主 程序 外 ， 每 个 
结 点 要 么 有 两 个 子 结 点 ,要么 没有 子 结 点 ， 这 分 别 对 应 于 有 两 个 递归 调用 或 者 没有 递归 
调用 。 
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A TO 
i) 调用 BC(2,0) j) 返回 k) 返回 


图 2-29 图 2-28 的 运行 时 栈 
参照 图 2-30， 调 用 和 返回 序列 是 : 


Nd 


主 程序 
调用 BC(3, 1) 
调用 BC(2, 1) 
调用 BCA, 1) 
返回 BC(2, 1) 
调用 BC(1, 0) 


返回 BC(2, 1) 
返回 BC(3, 1) 
调用 BC(2, 0) 
返回 BC(3, 1) 
返回 主 程序 





图 2-30 图 2-28 所 示 程 序 的 调用 树 
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使 用 这 种 缩 进 样式 ， 一 行 到 下 一 行为 增加 缩 进 就 代表 一 次 函数 调用 ， 而 一 行 到 下 一 行为 


减少 缩 进 就 代表 一 次 函数 返回 。 可 以 把 
调用 树 的 执行 顺序 形象 化 ， 把 调用 树 想 
象 成 海 详 的 海岸 线 。 一 稻 船 从 主 程序 的 
左边 沿 着 海岸 线 开 始 航行 ， 并 一 直 保 持 
海岸 在 它 的 左边 。 船 会 按照 结 点 被 调用 
和 返回 相同 的 顺序 访问 结 点 ， 图 2-31 给 
出 了 访问 路 径 。 

当 从 微观 的 角度 分 析 递 归程 序 时 ， 


图 2-31 图 2-28 所 示 程 序 的 执行 顺序 


在 构建 运行 时 栈 的 跟踪 记录 之 前 ,构建 调用 树 更 容易 一 些 。 一 旦 构建 了 调用 树 ， 就 很 容易 看 
清楚 运行 时 栈 的 行为 。 每 当 船 在 树 中 向 下 访问 结 点 时 ， 程 序 分 配 栈 帧 ; 每 当 船 在 树 中 向 上 访 


问 结 点 时 ， 程 序 释放 栈 帧 。 


可 以 根据 调用 树 确定 运行 时 栈 的 最 大 高 度 。 只 需 记 录 到 达 调 用 树 最 低 结 点 时 分 配 的 栈 帧 


数量 ， 这 个 数 对 应 的 就 是 运行 时 栈 的 最 大 高 度 。 


按照 执行 顺序 来 画 调用 树 不 是 最 简单 的 方法 。 前 面 那 个 程序 的 执行 序列 从 下 面 开 始 : 


主 程序 
调用 BC(3, 1) 


调用 BC(2, 1) 
调用 BC(1, 1) 





不 应 该 用 这 样 的 顺序 来 画 调用 树 。 下 面 这 样 开始 比较 容易 一 些 : 


主 程序 
调用 BC(3, 1) 
返回 BC(3, 1) 


返回 BC(3, 1) 
返回 主 程序 





从 程序 代码 可 以 看 到 ，BC(3, 1) 会 调 
用 它 自 己 两 次 : BC(2, 1) 一 次 ，BC(2, 0) 
一 次 。 然 后 回 到 BC, 1) 确定 它 的 子 结 
点 ， 换 句 话 说， 就 是 要 先 确 定 本 结 点 的 
所 有 子 结 点 ， 然 后 再 分 析 每 个 子 结 点 的 
更 深层 次 的 调用 。 

相对 于 “深度 优先 ”的 构造 方法 ， 这 
是 用 “广度 优先 ”的 方法 来 构造 树 。 在 复 
杂 的 调用 树 中 多 次 返回 到 较 高 层 结 点 时 ， 
深度 优先 的 问题 就 来 了 。 你 可 能 不 记得 
该 结 点 的 执行 状态 是 什么 ， 也 就 不 能 确 
定 它 的 下 一 个 子 结 点 是 什么 。 如 果 一 次 
性 确定 了 一 个 结 点 的 所 有 子 结 点 ， 那 么 


#include <stdio.h> 


void reverse(char *str, int j, int k) { 


char temp; 

if G ek) f 
temp = str[j]; 
str[j] = str[k]; 
str[k] = temp; 


reverse(str, j + 1, k - 1); 


} // ra2 


int main() { 


char word[5] = "star"; 
printf ("%s\n", word); 
reverse(word, 0, 3); 

printf ("ts\n", word); // ral 
return 0; 





图 2-32 ”逆转 局 部 数组 元 素 的 递归 过 程 


就 不 需要 记得 所 有 结 点 的 执行 状态 。 


2.4.5 ”逆转 数组 元 素 顺 序 


图 2-32 是 一 个 递归 过 程 而 不 是 一 个 函数 。 空 函数 reverse) 不 返回 数值 ， 只 道 转 本 地 字 
符 数组 的 元 素 。C 语言 允许 程序 员 用 包含 在 双 引 号 中 的 字符 串 常量 初始 化 一 个 字符 数组 。 在 
主 程序 中 ，word 是 一 个 局 部 字符 数组 ， 初 始 化 为 常量 字符 串 "star"。 由 于 它 是 局 部 的 ， 因 此 
存储 在 运行 时 栈 上 main) 的 栈 帧 中。 数组 中 元 素 的 个 数 总 是 比 字 符 串 常量 的 字符 数 大 1， 这 
是 因为 在 字符 串 的 未 尾 有 一 个 额外 的 标记 符号 \0。 在 这 个 程序 中 ，word 有 5 个 元 素 ， 四 个 
字母 加 上 一 个 标记 符号 。 在 printf() 函数 调用 中 ， 占 位 符 %s 使 程序 从 数组 word 的 第 一 个 元 
素 开始 顺序 输出 ， 但 不 包括 标记 字符 。 

这 个 过 程 把 数组 str 中 str[j] 和 str[k] 之 间 的 字符 顺序 逆转 。 主 程序 是 想 逆转 's' A r 
间 的 字符 ， 因 此 它 调用 reverse()， 人 参数 j 为 0,k 为 3。 

这 个 过 程 通 过 把 问题 分 解 成 更 小 的 问题 来 解决 。 因 为 0 小 于 3， 该 过 程 知道 要 把 0 和 3 
之 间 的 字符 逆转 ， 所 以 它 把 str[0] 和 str[3] 互 换 ， 接 着 递归 调用 自己 来 交换 str[1] 和 str[2] 之 
间 的 字符 。 如 果 j 大 于 等 于 k， 就 不 需要 交换 ， 过 程 也 就 什么 都 不 用 做 。 图 2-33 展示 了 开始 
时 运行 时 栈 的 跟踪 记录 。 


















temp 
retAddr 
k 
op 
str 
temp temp temp 
retAddr retAddr retAddr 
k k k 
| 0 |; oj j 
str str str 











word [0] word [0] word [0] 
word [1] 


word [2] 


word [0] 


word [1] word [1] word [1] 
word [2] 


word [3] 


word [2] word [2] 


word [3] word [3] word [3] 


' f word [4] ' Tword [4] ' Tword [4] ' Tword [4] 


retAddr retAddr retAddr retAddr 
retVal retVal retVal retVal 
7 7 7 Ya 

a) char word[5] b) 调用 reverse c) 交换 s 和 z d) 调用 reverse 


= "star" (word, 0, 3) (word, 1, 2) 


图 2-33 图 2-32 所 示 程 序 的 运行 时 栈 


2.4.6 MNH 


汉 诺 塔 游戏 是 一 个 用 递归 技巧 就 能 方便 解决 的 经 典 计算 机 科学 问题 。 这 个 游戏 由 3 个 柱 
子 和 一 组 直径 不 同 的 盘子 组 成 。 柱 子 编号 为 1、2 和 3， 每 个 盘子 的 中 央 有 一 个 洞 ， 能 套 在 
柱子 上 。 游 戏 的 初始 设置 是 所 有 的 盘子 都 套 在 一 根 柱子 上 ， 没 有 盘子 直接 放 在 直径 比 它 小 的 
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盘子 上 。 图 2-34 是 4 个 盘子 的 初始 设置 。 
要 解决 的 问题 是 把 所 有 盘子 从 起 始 的 柱子 移 到 另 一 根 柱 


子 ， 并 遵循 下 列 规则 : | | 
。 每 次 只 可 以 移动 一 个 盘子 ， 只 能 把 一 根 柱子 顶部 的 盘子 
移动 到 男 一 根 柱子 项 部 。 | 2 |[ 3 | 


e 不 能 把 大 直径 的 盘子 放 在 小 直径 盘子 的 上 面 。 图 2-34 汉 详 塔 问题 示意 图 

解决 这 个 问题 的 过 程 有 3 个 参数 n、j 和 k， 其 中 : 

en 是 要 移动 的 盘子 数量 。 

e j 是 起 始 柱子 。 

e 上 是 目标 柱子 。 

j 和 k 是 整数 ， 用 于 标识 柱子 。 给 定 j Mk 的 值 ， 中 间 柱 子 的 编号 可 以 用 6-j-k 计算 表 
示 ， 所 谓 中 间 柱 子 就 是 既 不 是 起 始 柱子 也 不 是 目标 柱子 的 柱子 。 例 如 ， 如 果 起 始 柱子 是 1 而 
目标 柱子 是 3， 那 么 中 间 柱 子 是 6-1-3=2。 

要 把 n 个 盘子 从 柱子 j 移 到 柱子 k， 首 先 检查 是 否 n=1， 如 果 是 ,那么 简单 地 把 这 个 盘 
子 从 柱子 j 移 到 柱子 k 即 可 。 但 如 果 不 是 ， 就 把 问题 分 解 为 几 个 小 部 分 : 

e 把 n-1 个 盘子 从 柱子 j 移 到 中 间 柱 子 。 

e 把 一 个 盘子 从 柱子 j 移 到 柱子 k。 

e En- 个 盘子 从 中 间 柱 子 移 到 柱子 k。 

图 2-35 展示 了 把 4 个 盘子 从 柱子 1 移动 到 柱子 3 的 问题 分 解 。 
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a) 将 3 个 盘子 从 柱子 1 移 到 柱子 2 b) 将 1 个 盘子 从 柱子 1 移 到 柱子 3 c) 将 3 个 盘子 从 柱子 2 移 到 柱子 3 
图 2-35 ”假设 你 能 把 3 个 盘子 从 一 个 柱子 移动 到 另 一 个 时 ， 把 4 个 盘子 从 柱子 1 移 到 柱子 3 的 解决 方案 


假定 初始 n 个 盘子 的 堆放 顺序 是 正确 的 ， 这 样 的 操作 过 程 保证 盘子 不 会 放 在 比 它 直径 小 
的 盘子 上 上。 例如， 如 图 2-35 所 示 ， 要 把 4 个 盘子 从 柱子 1 移 到 柱子 3， 这 个 过 程 告诉 你 应 
该 把 最 上 面 的 3 个 盘子 从 柱子 1 移 到 柱子 2， 把 底部 的 一 个 从 柱子 1 移 到 柱子 3， 接着 再 把 
BB 3 个 从 柱子 2 移 到 柱子 3。 

把 最 上 面 的 3 个 盘子 从 柱子 1 移 到 柱子 2， 柱 子 1 上 就 只 剩 下 底部 的 一 个 盘子 。 这 个 盘 
子 是 直径 最 大 的 ， 因 此 在 移动 其 他 盘子 的 过 程 中 ， 放 在 它 上 面 的 任何 盘子 都 是 更 小 的 。 为 了 
把 底部 这 个 盘子 从 柱子 1 移 到 柱子 3， 柱子 3 必须 是 空 的 。 这 样 就 不 会 把 这 个 底部 的 盘子 放 
在 一 个 较 小 的 盘子 上 。 当 把 那 3 个 盘子 从 柱子 2 移 到 柱子 3 上 时 ,会 把 它们 放 在 当前 位 于 柱 
子 3 底部 的 最 大 的 盘子 上 ， 这 样 3 个 盘子 就 被 正确 地 放 在 柱子 3 ET- 

这 个 过 程 是 递归 的 。 第 一 步 要 把 3 个 盘子 从 柱子 1 移 到 柱子 2。 为 此 ， 要 把 2 个 盘子 从 
柱子 1 移 到 柱子 3， 再 把 另 一 个 盘子 从 柱子 1 移 到 柱子 2， 接 着 把 那 2 个 盘子 从 柱子 3 移 到 
柱子 2。 图 2-36 展示 了 这 个 移动 的 序列 。 根 据 前 述 推 理 ， 能 够 正确 地 实施 这 些 步 骤 。 在 把 2 
个 盘子 从 柱子 1 移 到 柱子 3 的 过 程 中 ， 可 以 把 这 两 个 盘子 中 的 任意 一 个 放 在 柱子 1 底部 的 两 
个 盘子 上 ， 不 用 担心 违反 规则 。 

最 终 ， 可 以 把 这 个 问题 归 约 到 只 需 移动 一 个 盘子 的 基础 步骤 ， 而 一 个 盘子 的 解决 方案 是 
容易 的 。 本 章 结尾 有 一 道 问题 就 是 对 汉 诺 塔 游戏 的 解决 方案 进行 编程 。 
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a) 将 2 个 盘子 从 柱子 1 移 到 柱子 3 b) 将 1 个 盘子 从 柱子 1 移 到 柱子 2 c) 将 2 个 盘子 从 柱子 3 移 到 柱子 2 
图 2-36 假设 你 能 把 2 个 盘子 从 一 个 柱子 移动 到 另 一 个 柱子 时 ， 把 3 个 盘子 从 柱子 1 移 到 柱子 2 的 解决 方案 


2.4.7 相互 递归 


在 有 些 问题 的 最 佳 解决 方案 中 ， 过 程 不 直接 调用 自己 ,但 是 它们 仍然 是 递归 的 。 假 设 一 
个 主 程序 调用 过 程 a4， 过程 a 包含 一 个 对 过 程 b 的 调用 。 如 果 过 程 b 又 包含 一 个 对 过 程 a 的 
调用 ,那么 a 和 b 是 相互 递归 的 。 尽 管 过 程 a 不 直接 调用 它 自己 ,但 是 通过 过 程 b， 它 间接 
地 调用 了 它 自己 。 

和 普通 递归 相 比 ， 相 互 递 归 的 实现 没有 什么 不 同 。 运 行 时 栈 上 分 配 栈 帧 的 方式 也 是 一 样 
的 ， 先 分 配 返 回 值 ， 然 后 是 参数 ， 接 着 是 返回 地 址 ， 再 是 局 部 变量 。 

不 过 ,在 C 程序 中 ， 声 明 相互 递归 过 程 时 有 一 个 小 问题 。 原 因 在 于 C 语言 要 求 程序 的 
声明 必须 先 于 它 的 使 用 。 如 果 过 程 a0 调用 过 程 b()， 那 么 在 代码 中 bO 的 声明 必须 在 a0 的 
声明 之 前 ; 但 是 如 果 过 程 b() 调用 过 程 a()， 那 么 在 代码 中 a() 的 声明 必须 在 b0 的 声明 之 前 。 
问题 是 ， 如 果 每 个 过 程 都 调用 另 一 个 ， 代 码 中 每 个 过 程 都 必须 出 现在 另 一 个 之 前 ， 这 显然 是 
不 可 能 的 。 

针对 这 种 情况 ，C 语言 提供 了 函数 原型 (function prototype)， 它 允许 程序 员 写 出 第 一 个 过 
程 的 头 ， 而 没有 过 程 体 。 函 数 原型 包括 完整 的 形 参 列 表 ， 但 在 程序 体 的 位 置 放 一 个 分 号 (;)。 
在 一 个 过 程 的 函数 原型 之 后 ， 就 可 以 是 第 二 个 过 程 的 声明 ， 然 后 是 第 一 个 过 程 的 过 程 体 。 

这 是 刚才 讨论 的 相互 递归 的 过 程 a() 和 b() 的 架构 : 

常量 、 类 型 、 主 程序 变量 

void a(SomeType x); 

void b(SomeOtherType y) { 


b 的 过 程 体 
} 
void a(SomeType x) { 
a 的 过 程 体 
} 
int main() { 
主 程序 的 执行 语句 
} 


如 果 b() 对 a() 有 一 个 调用 ， 编 译 器 将 会 核实 实 参 的 数量 和 类 型 是 否 与 前 面 在 函数 原型 
里 扫描 的 a 的 形 参 匹配 。 如 果 a() 对 b() 有 一 个 调用 ， 那 么 这 个 调用 会 在 a() 的 程序 体 中 ， 因 
为 b() 在 a) 的 代码 块 之 前 ， 因 此 编译 器 已 经 扫描 了 b() 的 声明 。 
尽管 相互 递归 不 如 递归 常见 ， 但 有 一 些 编译 器 是 基于 一 种 叫 作 递 归 下 降 (recursive 
descent) 的 技术 ， 这 个 技术 很 大 程度 上 使 用 了 相互 递归 。 看 看 C 语句 的 结构 ， 你 就 能 明白 为 
什么 是 这 样 。 把 一 个 if REE A while 中 ， 而 这 个 while LREHEA— iff}, KARA 
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可 能 的 。 在 使 用 递归 下 降 技术 的 编译 器 里 有 一 个 过 程 用 于 翻译 证 语句 ， 另 一 个 过 程 用 于 翻 
译 while 语句 。 当 正在 翻译 外 层 放 语句 的 过 程 遇 到 while 语句 时 ， os 
的 过 程 。 而 当 翻 译 while 语句 的 过 程 遇 到 舱 套 在 里 面 的 这 语句 时 ， 它 又 调用 翻译 讶 语句 的 过 
程 ， 因 此 是 相互 递归 的 。 


2.4.8 递归 的 成 本 


本 节 例 子 的 选取 只 基于 一 个 标准 : 例子 说 明 递 归 的 能 力 。 可 以 看 到 在 使 用 递归 的 解决 方 
案 中 ,运行 时 栈 需 要 大 量 的 存储 空间 ， 同 时 也 要 花费 时 间 分 配 和 释放 栈 帧 。 递 归 解 决 方案 在 
5 [ia] ANE fia) E ABE en 5 A 

如 果 一 个 问题 有 不 用 递归 的 简单 解法 ,那么 非 递归 方法 通常 优 于 递归 方法 。 图 2-18 
中 计算 阶乘 的 非 递 归 函 数 肯 定 比 图 2-22 的 递归 阶乘 函数 好 。 图 2-25 对 数组 元 素 求 和 与 
图 2-32 都 可 以 不 用 递归 ， 只 用 循环 就 可 以 很 容易 地 编程 。 

二 项 式 系 数 b(n, k) 有 一 个 基于 阶乘 的 非 递归 定义 : 

n! 
Ms k\(n—k)! 

如 果 非 递归 地 计算 阶乘 ， 基 于 这 个 定义 的 程序 可 能 比 相应 的 递归 程序 效率 高 很 多 。 两 种 
方法 的 选择 还 有 一 个 可 以 考虑 的 因素 : 非 递 归 方 法 需要 乘法 和 除法 ， 而 递归 方法 仅 需要 加 法 。 

有 些 问 题 本 质 上 就 是 递归 的 ， 仅 用 非 递 归 方 法 解决 非常 困难 。 汉 诺 塔 游戏 问题 的 解决 本 
质 上 就 是 递归 的 。 你 可 以 试 着 不 用 递归 去 解决 它 ， 看 看 到 底 会 有 多 难 。 快 速 排序 法 是 最 知名 
的 排序 算法 之 一 ， 也 属于 这 种 类 型 ， 用 非 递归 方法 对 快速 排序 进行 编程 比 用 递归 方法 难得 多 。 


本 章 的 C 程序 很 简短 ， 除 了 inain0) 
之 外 加 上 了 很 少 的 几 个 函数 。 而 且 这 些 
附加 函数 全 都 包含 在 与 主 函数 相同 的 文 
件 内 。 典 型 的 商业 应 用 程序 由 几 十 或 几 
百 个 附加 函数 组 成 ， 这 使 得 单个 文件 不 
可 能 包含 整个 应 用 程序 。 

“组 织 大 型 软件 项 目的 通用 惯例 是 将 


小 组 相关 函 教 集中 到 单独 的 文件 中 。 在 C 


语言 中 ， 这 样 的 函数 集合 文件 有 两 种 类 
A: 扩展 名 为 由 的 头 文件 和 扩展 名 为 .c 
的 源 文 件 。 例 如， 程序 开头 的 区 aclude 


语句 指示 编译 器 引入 输入 /输出 库 的 头 文 


“ 件 stdio:h。 头 文件 包 合 了 每 个 函数 声明 


的 头 部 ， 即 返回 类 型 函数 名 和 和 形 参 列 “ 
表 。 相 应 的 源 文件 不 仅 包含 了 每 个 函数 


“的 头 部 ， 还 包含 了 实现 它 的 C 代码。 


“集成 开发 环境 (IDE) 是 给 软件 开发 
:大 员 使 用 的 应 用 程序 ; 用 于 编写 包含 许 





多 头 文件 和 源 文 件 的 大 型 程序 。 典 型 的 
IDE 具有 用 于 编写 源 代码 的 集成 文本 纺 
辑 器 和 用 于 管理 项 目 中 的 所 有 头 文件 和 
源 文件 的 点 击 式 界面 。 文 本 编辑 器 提供 
了 源 代码 的 语法 高 亮 显示 ， 以 及 关键 字 
和 标识 符 的 代码 补 全 。IDE 为 编译 器 提 
供 了 图 形 用 户 界面 ， PEER | MUR 
供 了 集成 窗口 。 

— & bh BR Ht AT HY IDE is NetBeans, 
Eclipse, Qt Creator, Visual Studio 和 
Xcode. NetBeans 是 一 个 开源 的 IDE， 它 
起 源 于 学 生 项 目 ， 并 被 发 起 Java 编 程 


”语言 的 Sun Microsystems 公司 所 接受 。 





Oracle 收购 Sun ja, 2 # 4k 47 NetBeans 


项 目 ， 生 仍然 维护 着 它 。 Eclipse 也 是 


开 源 IDE， 由 IBM 开 发 。NetBeans 和 


Eclipse 都 是 用 Java 编 写 的 ， 但 为 开发 ， 


人 员 提 供 了 不 同 编程 语言 的 选择 ， 包 
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冲突 问题 。 版 本 控制 系统 对 该 问题 的 处 ”图 2-37 图 2-32 所 示 程序 的 NetBeansIDE [TOI 


25 动态 内 存 分 配 


在 C 语言 中 ， 值 存储 在 主 存储 器 的 3 个 不 同 区 域 : 

o 全 局 变量 存储 在 内 存 的 固定 位 置 。 

o 局 部 变量 和 参数 存储 在 运行 时 栈 。 

。 动态 分 配 的 变量 和 参数 存储 在 堆 中 。 

过 程 调 用 和 返回 时 ， 不 能 控制 堆 的 分 配 和 释放 ， 而 是 借助 于 指针 变量 来 分 配 堆 。 堆 的 分 
配 被 称 为 动态 内 存 分 配 ， 它 不 是 通过 过 程 调 用 在 运行 时 栈 上 自动 触发 的 。 


2.5.1 指针 


当 声 明 一 个 全 局 或 者 局 部 变量 时 ， 要 指定 它 的 类 型 。 例 如 ， 可 以 把 类 型 指定 为 整数 、 字 
符 或 数组 。 类 似 地 ， 当 声明 一 个 指针 时 ， 必 须 声 明 它 所 指向 的 类 型 。 指 针 本 身 可 以 是 全 局 变 
量 ， 也 可 以 是 局 部 变量 ,但 是 它 指 向 的 值 位 于 堆 中 ， 既 不 是 全 局 变量 也 不 是 局 部 变量 。 

C 语言 提供 了 两 个 函数 来 控制 动态 内 存 分 配 : 

e malloc()， 在 堆 中 分 配 一 块 空间 。 
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e free()， 释 放 堆 中 的 一 块 空间 。 

虽然 用 free() 函数 释放 内 存 非 常 重要 ， 但 本 书 并 不 阐述 它 是 怎样 操作 的 。 本 书 中 使 用 指 
针 的 程序 都 是 软件 设计 的 不 好 例子 ， 因 为 省 略 了 释放 的 过 程 。 这 些 程序 的 目的 是 展示 HOL6 
层 和 Asmb5 层 之 间 的 关系 ， 到 第 6 章 ， 这 个 关系 就 会 变 得 更 明显 ， 因 为 第 6 章 会 讲述 程序 
的 翻译 。 

malloc() 函数 的 参数 是 为 其 实 参 分 配 的 内 存 字 节 数 ， 它 执行 时 做 两 件 事 情 : 

。 在 堆 中 分 配 一 个 内 存单 元 ， 大 小 


等 于 其 参数 指定 的 字 节 数 。 3 
amti, Kaname | fana aeae 
储 空间 。 int *a, *b, *c; 
与 指针 有 关 的 赋值 有 两 种 : 给 指针 int main() { 
赋 一 个 值 ， 或 者 给 指针 指向 的 单元 赋 一 wy pi *) malloc (sizeof (int)); 
个 值 。 第 一 种 赋值 叫 指 针 赋 值 ， 它 按照 = ink aj manned pel eaanelaesy, 
下 列 规则 执行 : *b = 3; 
o 如 果 p 和 4q 是 指针 ， 赋 值 p=q 使 2 re 
得 p 指向 q 指 向 的 同一 单元 。 see Wa hey 
图 2-38 是 一 个 无 实际 意义 的 程序 ， printf ("+a = %d\n", *a); 
只 是 为 了 说 明 malloc() 的 行为 以 及 指针 i le 


printf ("*c %d\n", *c); 


return 0; 


赋值 的 规则 。 它 使 用 全 局 指针 ， 如 果 是 
局 部 指针 ， 输 出 也 是 一 样 的 。 如 果 是 局 
部 指针 ， 那 么 它们 会 分 配 在 运行 时 栈 上 
而 不 是 内 存 的 固定 位 置 中 。 

在 全 局 指针 的 声明 中 

int *a, *b, *c; 


$ 一 个 1 实际 意义 语言 
变量 名 前 的 星 号 表示 这 个 变量 是 一 个 指 图 2-38 一 个 说 明 指 针 类 型 的 无 实际 意义 的 C 语 言 程序 


向 整数 的 指针 ， 而 不 是 整数 。 图 2-39a 
将 一 个 指针 的 值 图 形 化 地 表示 为 了 一 个 小 黑 点 。 


pase ha 
b 
e 











e)*b = 3 fhe =a 


图 2-39 图 2-38 所 示 程 序 的 跟踪 记录 


图 2-39b 说 明了 malloc) 函数 的 行为 。sizeof() 函数 接受 一 个 类 型 ， 返 回 的 是 保存 一 个 
具有 该 类 型 的 数值 所 需 的 字 节 数 。 第 一 个 赋值 语句 中 的 表达 式 (int *) 是 一 个 类 型 转换 。 由 
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F malloc) 返回 的 是 通用 指针 ， 所 以 需要 类 型 转换 把 这 个 通用 指针 变 成 指向 int 的 指针 。 结 
果 就 是 ， 调 用 malloc() 在 堆 上 分 配 了 一 个 足够 大 的 单元 来 存储 整数 值 ， 并 返回 一 个 指向 该 值 
的 指针 。 这 个 赋值 使 得 a 指向 新 分 配 的 单元 。 图 2-38c 展示 了 怎样 访问 指针 指向 的 单元 。 因 
为 a 是 指针 ， 所 以 *a 是 指针 a 指向 的 单元 。 图 2-38f 说 明了 指针 赋值 规则 。 赋 值 c=a 使 c 指 
向 a 指向 的 同一 单元 ; 类 似 地 ， 赋 值 a=b 使 a 指向 b 指向 的 那个 单元 。 在 图 2-38h 中 ， 该 赋 
值 不 是 对 指针 a 进行 赋值 ， 而 蚌 对 指针 a 指向 的 单元 进行 赋值 。 


2.5.2 ”结构 


结构 是 C 语言 中 数据 抽象 的 关键 。 它 们 允许 程序 员 把 基本 类 型 的 变量 整合 到 一 个 单一 
的 抽象 数据 类 型 中 。 数 组 和 结构 都 是 一 组 值 ， 不 过 数组 的 所 有 单元 要 求 类 型 必须 是 一 样 的 ， 
通过 整 型 数值 作为 索引 访问 每 个 单元 ; 而 在 结构 中 ， 各 个 单元 可 以 是 不 同类 型 的 。C 语言 
供 struct 结构 把 多 个 值 集合 成 一 个 组 。C 语言 程序 员 给 每 个 称 为 字段 的 单元 一 个 字段 名 。 

图 2-40 所 示 的 程序 声明 了 一 个 名 为 person 的 struct， 它 有 4 个 字段 ， 分 别 叫 作 first、 
last, age 和 gender。 该 程序 声明 了 一 个 叫 bill 的 全 局 变量 ， 其 类 型 为 person， 字 段 first、 
last 和 gender 是 char 类 型 ， 字 段 age 是 int 类 型 。 


#include <stdio.h> 


struct person { 
char first; 
char last; 
int age; 
char gender; 
}e 


struct person bill; 


int main() { 


scanf ("$c%c%d tc", &bill.first, &bill.last, &bill.age, &bill.gender) ; 
printf ("Initials: tc%c\n", bill.first, bill.last) ; 
printf ("Age: d\n", bill.age) ; 
printf ("Gender: "); 
if (bill.gender == 'm') { 
printf ("male\n") ; 
} 
else { 
printf ("female\n") ; 
} 


return 0; 


Initials: bj 
Age: 32 
Gender: male 





2-40 C 的 结构 


为 了 访问 结构 的 字段 ， 在 变量 和 要 访问 的 字段 之 间 放 一 个 点 ， 例 如 ， 让 语句 的 测试 条 件 
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if (bill.gender == 'm') 


将 访问 变量 bill 的 名 为 gender 的 字段 。 


2.5.3 ” 链 式 数据 结构 


程序 员 经 常 把 指针 和 结构 结合 起 来 实现 链 式 数据 结构 。struct 通常 被 称 为 结 点 ， 指 针 指 

向 结 点 ， 结 点 中 又 有 指针 字段 。 在 数据 结构 中 ， 结 点 的 指针 字段 作为 指向 另 一 个 结 点 的 链 

，| 接 。 图 2-41 是 一 个 实现 链表 ( linked list) 数据 结构 的 程序 ， 第 一 个 循环 输入 一 个 整数 序列 ， 

105| 以 特殊 的 标记 符号 值 -9999 结束 ， 输 入 流 中 的 第 一 个 值 放 在 链表 的 末端 第 二 个 循环 输出 
链表 中 的 每 个 元 素 。 图 2-42 是 图 2-41 所 示 程 序 开 始 几 条 语句 执行 的 跟踪 记录 。 


#include <stdio.h> 
#include <stdlib.h> 


struct node { 
int data; 
struct node *next; 
je 
int main() { 
struct node *first, *p; 


int value; 
first = 0; 
scanf ("%d", &value) ; 
while (value != -9999) { 
p = first; 
first = (struct node *) malloc (sizeof (struct node) ); 


first-sdata = value; 
first->next = p; 
scanf("%d", &value); 
} 
for (p = first; p != 0; p = p->next) { 
printf ("td ", p->data) ; 


} 


return 0; 


输入 
10 20 30 40 -9999 


输出 
40 30 20 10 





图 2-41 一 个 输入 和 输出 链表 的 C 程序 
指针 值 为 0 是 一 个 特殊 的 值 ， 它 保证 指针 不 指向 任何 单元 。 在 C 程序 中 ， 它 通常 用 作 
一 个 链 式 结构 的 标记 符号 值 。 语 句 
first = 0; 
把 这 个 特殊 的 值 赋 给 局 部 指针 first. KI 2-42b 把 这 个 值 图 形 化 地 表示 为 一 个 虚线 三 角 。 


用 星 号 来 访问 指针 指向 的 单元 ， 用 点 来 访问 结构 的 字段 。 如 果 一 个 指针 指向 一 个 struct， 
那么 要 访问 struct 中 的 字段 就 必须 同时 使 用 星 号 和 点 。 


value 
P 
first 


a) main () É 的 初始 状态 b) first = 0 c) scanf ("%$d", &value) 


value | 10 | value 10 | value | 10 | 
: E ef e | 
first = l first = [|| first | 一 


7 7 A 
d) p = first e) first = ... malloc(...) f) first->data = value 


value 











g) first->next = p h) scanf("%d", &value) i)p = first 
value 
JES 
= E 
id = 





j) first = .. malloc(...) 





1) first->next = p m) scanf ("%d", &value) 


图 2-42 图 2-41 所 示 程 序 的 前 几 条 语句 执行 的 跟踪 记录 
下 列 语句 将 变量 value 的 值 赋 给 变量 first 指向 的 结构 的 data 字段 : 


(*first) .data = value; a 


因为 这 种 星 号 和 点 的 组 合 太 常 用 了 ， 所 以 C 语言 提供 了 箭头 运算 符 -> ， 其 格式 是 一 
连接 符 紧 接 一 个 大 于 符号 。 例 2.7 中 的 语句 可 以 用 这 个 运算 符 简 写 为 


first-sdata = value; 


如 图 2-42f、k 所 示 。 该 程序 用 同样 的 简写 访问 next 字段 ， 如 图 2-42g、1 所 示 。 


本 章 小 结 


在 C 语言 中 ,， 值 存储 在 主 存储 器 的 3 个 不 同 区 域 中 : 全 局 变量 存放 在 内 存 中 的 固定 位 
置 ; 局 部 变量 和 参数 存放 在 运行 时 栈 ; 动态 分 配 的 变量 存放 在 堆 中 。 改 变 控 制 流 一 般 顺 序 的 
方法 有 两 种 : 选择 和 循环 。C 语言 的 让 和 switch 语句 实现 选择 ，while do 和 for 语句 实现 
循环 。 所 有 5 种 语句 都 用 关系 运算 符 测 1 试 条 件 的 真 伪 。 

运行 时 栈 的 LIFO 特性 用 于 实现 函数 和 过 程 调用 。 顶 数 的 分 配 过 程 是 : 压 人 返回 值 的 存 
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储 空间 ， 压 入 实 参 、 压 入 返回 地 址 、 压 入 局 部 变量 的 存储 空间 。 过 程 的 分 配 过程 除 了 不 压 入 
返回 值 的 存储 空间 之 外 都 是 一 样 的 。 栈 帧 是 由 一 次 函数 或 过 程 调 用 中 压 入 运行 时 栈 的 所 有 项 
组 成 的 。 

递归 过 程 是 一 种 调用 自己 的 过 程 。 为 了 避免 无 休止 地 调用 自己 ， 递 归程 序 必 须 有 一 个 if 
语句 ， 作 为 停止 递归 调用 的 安全 出 口 。 微 观 和 宏观 是 两 种 不 同 的 思考 递归 的 角度 。 微 观 角度 
考虑 程序 执行 期 间 运 行 时 栈 的 细节 ， 而 宏观 角度 基于 更 高 的 抽象 层次 ， 与 数学 归纳 法 证 明 相 
关 。 微 观 角度 用 于 分 析 ， 宏 观 角 度 用 于 设计 。 

用 malloc() 函数 在 堆 上 分 配 存储 空间 称 为 动态 内 存 分 配 。malloc() 函数 在 堆 上 分 配 一 
个 内 存单 元 ， 并 返回 一 个 指向 该 新 分 配 单元 的 指针 。 结 构 是 一 组 值 ， 在 C 语言 中 表示 为 
struct， 它 不 要 求 所 有 的 值 都 是 同一 类 型 。 每 个 值 存储 在 一 个 字段 中 ， 每 个 字段 有 一 个 名 字 。 
链 式 数据 结构 由 结 点 组 成 ， 这 些 结 点 都 是 结构 ， 结 构 中 有 指针 指向 其 他 的 结 点 。 链 表 中 的 结 
点 有 一 个 值 字段 ， 还 有 一 个 通常 名 为 next 的 字段 ， 它 指向 链表 中 的 下 一 个 结 点 。 


练习 

2.4 节 

1. 主 程序 第 一 次 调用 图 2-25 中 的 函数 sum()， 从 第 二 次 开始 它 就 自己 调用 自己 。 

*(a) 将 main) 调用 计算 在 内 ， 该 函数 总 共 被 调用 了 多 少 次 ? 

(b) 画 出 函数 第 三 次 被 调用 后 主 程序 变量 和 运行 时 栈 的 情况 。 不 要 绘制 main() 的 栈 帧 ， 应 该 有 3 个 
Be hii. 

(c) 画 出 从 (b) 调用 返回 前 主 程序 变量 和 运行 时 栈 的 情况 。 应 该 有 3 个 栈 帧 ， 不 过 内 容 和 (b) 的 不 同 。 

2. 下 列 练习 包括 五 个 部 分 : (1 ) 假设 给 定 调用 语句 来 自主 程序 ， 以 图 2-30 为 例 ， 画 出 图 2-28 中 函数 
binCoeff() 的 调用 树 。(2 ) 用 92 页 9 的 缩 进 样式 写 出 调用 与 返回 顺序 。( 3 ) 将 主 程序 调用 计算 在 
内 ， 该 函数 总 共 被 调用 了 多 少 次 ? (4) 不 算 主 程序 的 栈 帧 ， 程 序 执行 期 间 ， 和 运行 时 栈 上 栈 帧 的 最 大 
数量 是 多 少 ? (5) 程序 执行 期 间 ， 按 照 图 2-29 的 样式 ， 画 出 给 定点 的 运行 时 栈 。 

*(a) 来 自主 程序 的 调用 语句 binCoeff(4, 1)。 对 (5) 而 言 ， 画 出 从 binCoeff(2, 1) 返回 前 的 运行 时 栈 。 
(b) 来 自主 程序 的 调用 语句 binCoeff(5, 1)。 对 (5) 而 言 ， 画 出 从 binCoeff(3, 1) 返回 前 的 运行 时 栈 。 
(c) 来 自主 程序 的 调用 语句 binCoeff(3, 2)。 对 (5) 而 言 ， 画 出 从 binCoeff(1, 0) 返回 前 的 运行 时 栈 。 
(d) 来 自主 程序 的 调用 语句 binCoeff(4, 4)。 对 (5) 而 言 ， 画 出 从 binCoeff(4, 4) 返回 前 的 运行 时 栈 。 
(e) 来 自主 程序 的 调用 语句 binCoeff(4, 2)。 对 (5) Mia, binCoeff (2,1) 被 调用 两 次 ， 画 出 从 第 二 

次 对 该 函数 进行 调用 返回 前 的 运行 时 栈 。 

. 给 出 图 2-32 中 道 转 字 符 串 数组 字母 顺序 的 程序 的 调用 树 ， 调 用 树 的 画 法 如 图 2-30 所 示 ， 假 设 初始 
字符 串 为 "Backward"。 包 括 来 自 main) AYIA EA, AZ reverse() 被 调用 了 多 少 次 ?包括 main() 
的 栈 帧 在 内 ， 在 运行 时 栈 上 分 配 的 栈 帧 的 最 大 数量 是 多 少 ? 包括 main) 的 栈 帧 在 内 ， 画 出 第 三 次 调 
用 函数 reverse() 后 的 运行 时 栈 。 

. 斐 波 那 契 数列 是 
01123581321… 

每 个 斐 波 那 契 数列 中 的 数 是 数列 中 它 前 面 两 个 数 之 和 。 数 列 最 开始 有 两 个 数 ， 递 归 地 定义 为 
0 n=0 
fib(n)=41 pel 
fib(n—1)+fib(n—2) n<1 
按照 图 2-30 的 样式 ， 画 出 下 列 斐 波 那 契 数 的 调用 树 : 


Ww 


~ 


日 ”此 页 码 指 的 是 英文 原 书页 码 ， 与 书 中 页 边 标注 的 页 码 一 致 。 一 一 编辑 注 


#2 C 7 


(a) fib(3) (b) fib(4) (c) fib(5) 
对 上 述 每 个 调用 ， 包 括 来 自 main) 的 调用 ，fib() 被 调用 了 多 少 次 ? 不 包括 main) 的 栈 帧 ， 在 运行 
时 栈 上 被 分 配 的 栈 帧 的 最 大 数量 是 多 少 ? 
5. 对 于 编程 题 14 中 汉 诺 塔 问题 的 解决 方案 ， 画 出 4 个 盘子 情况 的 调用 树 。 包 括 来 自 main() 的 调用 ， 
过 程 被 调用 了 多 少 次 ?不 包括 main) 的 栈 帧 ， 运 行 时 栈 上 栈 帧 的 最 大 数量 是 多 少 ? 
6. 神秘 数字 递归 地 定义 为 
2 n=0 
myst(n)=41 n=] 
2x myst(n-1)+myst(n-2) n>l 
(a) 按照 图 2-30 的 样式 ， 画 出 myst(4) 的 调用 序列 。 
(b) myst(4) 的 值 是 什么 ? 
7. 检查 下 面 的 C 程序 。( a) 画 出 过 程 最 后 一 次 被 调用 后 的 运行 时 栈 ， 需 包括 main() 的 栈 帧 。(b) 程序 
的 输出 是 什么 ? 
#include <stdio.h> 
void what (char *word, int j) { 
if (j >1) { 
word[j] = word([3 - jl; 
what (word, j - 1); 
} // ra2 
} 
int main() { 
char str[5] = "abcd"; 
what (str, 3); 
printf ("ss\n", str); // ral 


return 0; 


} 
编程 题 
2.1 
8. 写 一 个 C 程序 ， 输 入 两 个 整数 ， 输 出 它们 的 商 和 余数 。 要 输出 % 符号 ， 必 须 在 格式 字符 串 中 写 
为 %%。 
输入 样本 
13 4 
输出 样本 
13/4 has value 3. 
13%4 has value 1. 
2.2 43 
9. 写 一 个 C 程序 ， 输 入 一 个 整数 ， 输 出 这 个 整数 是 否 是 偶数 。 
输入 样本 
15 
输出 样本 


15 is not even. 
10. 写 一 个 C 程序 ， 输 入 两 个 整数 ， 输 出 这 两 个 整数 之 间 的 整数 之 和 。 


输入 样本 
9 12 
输出 样本 


The sum of the numbers between 9 and 12 inclusive is 42. 
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ll: 


写 一 个 C 函数 


int rectArea (int len, int wid) 


返回 长 为 len 宽 为 wid 的 矩形 的 面积 。 用 一 个 输入 为 矩形 的 长 和 宽 、 输 出 为 矩形 面积 的 主 程序 测试 
它 。 在 主 程序 中 而 不 是 函数 中 输出 该 值 。 











输入 样本 
6 10 
输出 样本 
The area of a 6 by 10 rectangle is 60. 
12. 写 一 个 C 函数 
void rect(int *ar, int *per, int len, int wid) 
计算 长 为 len 宽 为 wid 的 矩形 的 面积 ar 和 周 长 per。 用 一 个 输入 为 矩形 的 长 和 宽 、 输 出 为 矩形 面积 
和 周 长 的 主 程序 来 测试 它 。 在 主 程序 中 而 不 是 函数 中 输出 值 。 
输入 样本 
6 10 
输出 样本 
Length: 6 
Width: 10 
Area: 60 
Perimeter: 32 
2.4 5 
13. 写 一 个 C 程序 ， 请 用 户 输入 一 个 小 的 整数 ， 然 后 用 递归 函数 返回 练习 4 中 定义 的 斐 波 那 契 值 。 不 
要 使 用 循环 。 在 主 程序 中 而 不 是 函 数 中 输出 值 。 
输入 /输出 样本 
Which Fibonacci number? 8 
The number is 21. 
14. 写 一 个 C 程序 打印 汉 诺 塔 问题 的 解决 方案 。 要 求 用 户 输 入 游戏 中 盘子 的 数量 ， 所 有 盘子 初始 是 在 
哪 根 柱子 上 ， 要 被 移动 到 哪 根 柱子 上 。 
输入 /输出 样本 
How many disks do you want to move? 3 
From which peg? 3 
To which peg? 2 
Move a disk from peg 3 to peg 2. 
Move a disk from peg 3 to peg 1. 
Move a disk from peg 2 to peg 1. 
Move a disk from peg 3 to peg 2. 
Move a disk from peg 1 to peg 3. 
Move a disk from peg 1 to peg 2. 
Move a disk from peg 3 to peg 2. 
15. 写 一 个 名 为 rotateLeft() 、 返 回 值 为 空 的 递归 函数 ， 它 有 两 个 参数 ， 一 个 数组 和 一 个 整数 个 数 n。 函 


数 循环 左 移 一 个 数组 的 前 n 个 整数 。 为 了 循环 左 移 n 个 元 素 ， 要 递归 地 循环 左 移 前 n-1 个 元 素 ， 
然后 交换 最 后 两 个 元 素 。 例 如 ， 循 环 左 移 5 个 元 素 : 


50 60 70 80 90 


先 递归 地 循环 左 移 前 4 个 元 素 : 
60 70 80 50 90 
然后 交换 后 两 个 元 素 : 

60 70 80 90 50 


写 一 个 主 程序 来 测试 它 ， 输 入 一 个 整数 的 个 数 ， 然 后 是 要 循环 移动 的 整数 数值 。 输 出 是 原 整 数值 和 
循环 移动 后 的 值 。rotateLeft() 中 不 要 使 用 循环 ， 在 主 程序 中 而 不 是 函数 中 输出 值 。 

输入 样本 

5 50 60 70 80 90 

输出 样本 


Original list: 50 60 70 80 90 
Rotated list: 60 70 80 90 50 


16. 写 一 个 函数 
int maximum (int list[], int n) 
递归 地 找 出 list[0] 和 list[n] 之 间 最 大 的 整数 。 假 设 数列 中 至 少 有 一 个 元 素 。 用 主 程序 测试 它 ， 输 入 
是 整数 数量 ， 接 着 是 整数 数值 。 输 出 是 原 整 数值 ， 接 着 是 最 大 整数 值 。maximum 中 不 要 使 用 循环 。 
在 主 程序 中 而 不 是 函数 中 输出 值 。 
输入 样本 
5 50 30 90 20 80 
输出 样本 


Original list: 50 30 90 20 80 
Largest value: 90 


2.5% 
17. 图 2-41 的 程序 生成 了 一 个 元 素 顺序 与 输入 时 相反 的 链表 。 修 改 程序 的 第 一 个 循环 ， 使 生成 的 链表 
和 输入 顺序 一 致 。 不 要 改动 第 二 个 循环 。 
输入 样本 
10 20 30 40 -9999 
输出 样本 
10 20 30 40 
18. 二 又 搜索 树 的 结 点 声明 如 下 : 


struct node { 
node *left; 
int data; 








node *right; 
he 
left 是 指向 左 子 树 的 指针 ,right 是 指向 右 子 树 的 指针 。 编 写 一 个 C 程序 ， 输 入 一 个 整数 序列 , -9999 
为 标记 符号 ， 把 它们 插 和 人 二 又 搜索 树 。 用 递归 过 程 中 序 遍 历 搜索 树 ， 并 以 升序 输出 这 些 数值 。 


输入 样本 
40 90 50 10 80 30 70 60 20 -9999 


输出 样本 
10 20 30 40 50 60 70 80 90 
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信息 的 表示 





印刷 字 是 人 类 最 重要 的 发 明之 一 。 我 们 看 到 的 本 书页 面 上 的 文字 代表 存储 在 纸 上 的 信 
息 ， 在 阅读 时 ， 这 些 信息 就 传递 给 我 们 。 就 像 印 刷 的 页 面 一 样 ， 计 算 机 的 内 存 用 于 存储 信 
息 。 中 央 处 理 单元 (CPU) 能 够 从 内 存 中 获取 信息 ， 就 像 从 页 面 上 的 文字 中 获取 信息 一 样 。 

一 些 计算 机 术语 就 是 来 自 这 样 的 类 比 。CPU 从 内 存 读 取 (read) 信息 ， 把 信息 写 入 
(write) 内存 ， 这 些 信息 被 分 隔 为 字 ( word)。 在 一 些 计 算 机 系统 中 ， 一 大 组 字 ， 通常 从 几 百 
到 几 千 不 等 ， 又 组 成 页 (page). 

位 于 HOL6 层 的 C， 信 息 以 存储 在 内 存 中 的 变量 或 者 磁盘 中 的 文件 中 值 的 形式 存在 。 本 
章 将 展示 在 ISA3 层 上 信息 是 如 何 存 储 的 。 机 器 层 的 信息 表示 与 高 级 语言 级 的 表示 大 为 不 
同 。 在 ISA3 层 上 ,信息 表示 不 太 以 人 为 本 。 我 们 在 后 面 的 章节 讨论 中 间 层 Asmb5 层 和 OS4 
层 上 的 信息 表示 ， 以 及 它们 与 HOL6 层 和 ISA3 层 的 关系 。 


3.1 无 符号 二 进 制 表示 


早期 的 计算 机 是 机 电 式 的 ， 即 所 有 计算 是 通过 称 为 继电器 (relay) 的 移动 开关 来 实现 
的 。 哈 佛 大 学 的 Howard H. Aiken (霍华德 WE) 于 1944 年 建造 的 Mark I 计算 机 就 是 这 种 
类 型 的 机 器 。 这 个 项 目 上 ，Aiken 获得 了 国际 商用 机 器 公司 (IBM) 总 裁 Thomas J. Watson 
的 资金 支持 。 当 时 ，Mark I 计算 机 中 的 继电器 比 加 法 计算 器 中 的 机 械 齿 轮 计 算 速 度 快 得 多 。 

甚至 在 Mark I 完成 之 前 ， 艾 奥 瓦 州立 大 学 的 John V. Atanasoff 已 经 构造 完成 了 一 台 用 
于 解 线 性 方程 的 电子 计算 机 。1941 年 ，John W. Mauchly 访问 Atanasoff 的 实验 室 ，1946 年 
SRA EW KEN J. Presper Eckert 合作 建造 了 著名 的 电子 数值 积分 计算 机 (ENIAC), ff 
比 于 Mark I 继电器 的 每 秒 10 次 ，ENIAC 的 19 000 个 真空 管 每 秒 可 以 执行 5000 次 加 法 。 与 
ENIAC 一 样 ， 现 代 计 算 机 也 是 电子 的 ， 不 过 执行 计算 的 是 集成 电路 (IC) 而 不 是 真空 管 。 


3.1.1 ”二进制 存储 


电子 计算 机 的 内 存 不 能 直接 存储 数字 和 字母 ， 它 们 只 能 存储 电子 信号 。 当 CPU 从 内 存 
读 取信 息 时 ， 它 检测 到 一 个 信号 ， 其 电压 等 于 两 节 手 电 简 电池 产生 的 电压 。 

计算 机 内 存 有 一 个 最 显著 的 性 质 : 每 个 存储 位 置 包含 一 个 高 电 平 信号 或 者 低 电 平 信号 ， 
绝 不 会 是 两 者 之 间 的 其 他 信号 。 存 储 位 置 就 像 是 怀孕 一 样 ， 要 么 怀 了 要 么 没 怀 ， 没 有 折 中 的 
可 能 。 

数字 (digital) 这 个 词 意味 着 存储 在 内 存 中 的 信号 只 能 有 固定 数量 的 数值 。 二 进 制 意味 
着 仅 有 两 个 可 能 的 值 。 实 际 上 ,现在 市 场 上 所 有 计算 机 都 是 二 进 制 的 ， 因 此 每 个 存储 位 置 

一 个 高 电 平 或 者 一 个 低 电 平 ， 每 个 位 置 的 状态 也 被 描述 为 开 或 关 ， 或 者 描述 为 包含 1 
或 0。 

每 个 存储 单元 称 为 二 进 制 数字 (binary digit) 或 位 (bit， 也 译作 比特 )。1 位 只 能 是 1 或 


0， 绝 不 可 能 是 其 他 诸如 2、3、A 或 Z 之 类 ， 这 是 基本 概念 。 


不 管 是 你 的 信用 卡 透支 总 额 还 是 你 的 街道 地 址 ， 都 是 以 二 
进 制 1 和 0 的 形式 存储 的 。 

实际 上 ,计算 机 存储 器 中 的 位 被 组 合 在 一 起 形成 单元 
(cell), 例如， 一 台 7 位 的 计算 机 会 以 如 图 3-1a 所 示 的 每 7 
位 组 成 一 组 的 方式 存储 它 的 信息 。 你 可 以 把 单元 想 作 一 组 
方 框 ， 每 个 方 框 包含 一 个 1 或 0， 除 此 之 外 什么 都 没有 。 图 
3-1b 展示 了 一 个 7 位 单元 可 能 存储 的 一 些 二 进 制 值 ,， 图 c 
中 的 值 是 不 可 能 的 ， 因 为 有 的 方 框 中 的 数字 不 是 0 或 1。 

计算 机 系统 中 不 同 部 分 的 每 个 单元 位 数 也 不 同 。 实 际 
上 ， 所 有 现代 计算 机 的 主 存 和 磁盘 中 的 每 个 单元 都 有 8 位 。 
一 个 8 位 单元 被 称 为 一 个 “ 字 节 ”( byte)。 而 系统 其 他 部 分 
则 有 不 同 的 位 数 。 本 章 给 出 几 个 不 同 单元 大 小 的 例子 来 说 
明 普 适 原理 。 

诸如 数字 和 字母 这 样 的 信息 必须 以 二 进 制 的 形式 表示 
才能 存储 到 内 存 中 。 用 于 存储 信息 的 表示 方式 叫 作 编码 
(code)。 本 节 给 出 存储 无 符号 整数 的 编码 ， 本 章 其 他 小 节 描 
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计算 机 内 存 中 存储 的 每 条 信息 ， 


a) 一 个 7 位 的 单元 


lelei elsi 

Platel 

c ) 一 个 7 位 单元 中 不 可 能 的 值 
图 3-1 主 存 中 7 位 的 内 存单 元 


述 了 存储 其 他 类 型 数据 的 编码 ， 下 一 章 将 分 析 内 存 中 存储 程序 命令 的 编码 。 


3.1.2 BH 


数字 必须 以 二 进 制 形式 表示 才能 存储 到 计算 机 内 存 中 。 有 具体 的 编码 视 这 个 数字 有 小 数 部 
分 还 是 整数 而 定 。 如 果 是 整数 ， 那 么 编码 也 取决 于 它 永 远 是 正 的 还 是 也 可 以 为 负 。 

无 符号 二 进 制 (unsigned binary) 用 于 表示 永远 为 正 的 整数 。 在 学 习 二 进 制 之 前 ， 我 们 
先 复习 十 进 制 (decimal 或 缩写 dec)， 然 后 按 这 个 方法 学 习 二 进 制 。 

十 进 制 的 发 明 也 许 是 因为 我 们 用 10 根 手 指 计数 和 做 加 法 ， 使 用 这 个 优雅 规制 写 的 算术 
书 出 现在 公元 8 世纪 的 印度 ， 它 被 翻译 成 阿拉 伯 文 并 最 终 被 商人 带 到 了 欧洲 ， 在 这 里 它 又 从 
阿拉 伯 文 翻译 成 拉丁 文 。 因 为 那 时 人 们 认为 它 起 源 于 阿拉 伯 ， 所 以 数字 被 称 为 阿拉 伯 数 字 ， 
但 是 印度 -阿拉伯 数字 应 该 是 更 准确 的 名 字 ， 因 为 它 实 际 上 起 源 于 印度 。 


以 10 为 底 的 阿拉 伯 数 字 计 数 如 下 (当然 是 向 下 读 ): 


Nu WN — © 
m 
© 
一 
N 
N 
— 
Ww 
一 
Ww 
œ 


从 0 开始 ， 印 度 人 接着 发 明了 下 一 个 数字 1 的 符号 ， 然 后 是 2， 直 到 符号 9。 这 时 ， 他 
们 看 着 自己 的 手 想到 了 一 个 神奇 的 点 子 。 在 最 后 一 根 手 指 后 面 ， 他 们 没有 发 明 新 的 符号 ， 而 


是 用 前 面 两 个 符号 1 和 0 一 起 表示 下 一 个 数字 10。 


剩 下 的 故事 你 都 知道 了 。 当 到 19 时 ， 他 们 看 到 9 是 他 们 创造 的 符号 中 最 高 的 符号 了 ， 
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因此 他 们 把 它 降 到 0 同时 把 1 增加 到 2， 这 样 形成 20。 从 29 到 30， 最 终 99 到 100， 不 断 地 
继续 ， 都 是 同样 的 处 理 。 

如 果 我 们 仅 有 8 个 指头 而 不 是 10 个 将 会 怎样 呢 ? 到 了 7， 下 一 个 数字 用 完了 最 后 一 根 
手指 ， 我 们 不 必 发 明 一 个 新 符号 ， 下 一 个 数字 会 以 10 来 表示 。 以 8 为 底 (八进制 octal 或 
缩写 为 oct) 计数 是 这 样 的 : 

0 7 16 25 34 43 


一 
— 
N 
N 
_ 
w 
© 
w 
N 
A 
oO 


6 15 24 33 42 


八进制 中 77 的 下 一 个 数字 是 100. 
比较 十 进 制 和 八进制 方法 ， 你 会 注意 到 八进制 的 5 (oct) 和 十 进 制 的 5 (dec) 是 同样 的 
数字 ， 但 八进制 21 ( oct) 和 十 进 制 21 (dec) 是 不 一 样 ， 反 而 和 十 进 制 17 (dec) 是 一 样 的 。 
数字 以 八进制 表示 看 上 去 比 它们 实际 上 以 十 进 制 表示 要 显得 大 一 些 。 
假如 我 们 不 是 有 10 个 或 者 8 个 指头 而 是 有 3 个 指头 会 怎样 呢 ? 规律 是 一 样 的 ， 三 进 制 
计数 是 这 样 的 : 
0 21 112 210 1001 1022 
l 2A 120 211 1002 1100 
2 100 121 212 1010 1101 
10 101 122 220 1011 1102 
11 102 200 221 1012 : 
12 110 201 222 1020 
20 111 202 1000 1021 
最 后 ,我 们 看 看 无 符号 二 进 制 表示 。 计 算 机 仅 有 两 根 手指 ， 以 2 为 底 (二 进 制 ，binary， 
或 简称 bin) 计数 遵循 与 八进制 和 三 进 制 完 全 相同 的 方法 : 
0 lll 1110 10101 11100 100011 
1 1000 1111 10110 11101 100100 
10 1001 10000 10111 11110 100101 
ll 1010 10001 11000 11111 100110 
100 1011 10010 11001 100000 : 
101 1100 10011 11010 100001 
110 1101 10100 11011 100010 
二 进 制 数 看 上 去 比 它们 实际 的 值 要 大 很 多 ， 二进制 数 10110 (bin) 只 是 十 进 制 的 22 
(dec). 


3.1.3 ”基数 转换 


给 定 一 个 二 进 制 数 ， 有 几 种 方法 来 确定 它 对 应 的 十 进 制 数 。 一 种 方法 是 简单 地 以 二 进 制 
和 十 进 制 往 上 数 到 那个 数 ， 这 种 方法 对 小 的 数字 非常 有 效 。 另 一 种 方法 是 把 二 进 制 数 每 个 为 
1 的 位 的 位 置 值 都 加 起 来 。 

GEE) 图 3-2a 展示 了 10110(bin) 的 位 置 值 ， 最 右边 是 1 的 位 置 值 ( 称 为 最 低 有 效 位 )， 
每 个 位 置 值 都 两 倍 于 它 前 面 的 那个 位 置 值 。 图 3-2b 展示 了 得 到 22 (dec) 的 加 法 。 m 


10110 
| tL mor faa 
证 = 
2 的 位 
= 1 4 的 位 置 =4 
T 0 8 的 位 置 =0 
8 的 位 置 1 16 的 位 置 = 16_ 
16 的 位 置 22 (dec) 
a) 10110 (bin) 的 位 置 值 b) 将 10110 (bin ) 转换 为 十 进 制 数 


图 3-2 将 二 进 制 数 转换 为 十 进 制 数 


GED 无 符号 二 进 制 类 似 于 我 们 熟悉 的 十 进 制 。 
图 3-3 展示 了 58 036 (dec) 的 位 置 值 。 数 字 58 036 代 
表 6 个 1,3 个 10, 没有 100,8 个 1000 和 5 个 10000。 
从 最 右边 1 的 位 置 开 始 ， 每 个 位 置 值 都 10 倍 于 它 前 
面 的 位 置 值 。 在 二 进 制 中 ， 每 个 位 置 值 是 两 倍 于 它 前 
面 的 那个 位 置 值 。 ® 

无 符号 数值 能 方便 地 表示 为 数 制 基底 的 多 项 
式 (基底 也 称 为 数 制 的 基数 (radix))。 图 3-4 给 出 了 
10110 (bin) #158 036 (dec) 的 多 项 式 表 示 。 最 低 有 
效 位 总 是 基数 的 0 次 方 ， 即 1。 接 下 来 的 有 效 位 是 基 
数 的 一 次 方 ， 即 基数 本 身 。 从 多 项 式 的 结构 可 以 看 到 
每 个 位 置 值 是 前 一 个 位 置 值 乘 以 基数 。 

在 二 进 制 中 ， 只 有 1 的 位 置 的 值 是 奇数 ， 所 有 其 
他 位 置 (2 的 位 置 、4 的 位 置 、8 的 位 置 等 ) 的 值 都 是 
偶数 。 如 果 1 的 位 置 的 值 是 0， 那 么 二 进 制 数 的 值 将 


5 8 0 3 6 
| i 
10 的 位 置 
100 的 位 置 
1000 的 位 置 
10 000 的 位 置 


图 3-3 58036 (dec) 的 位 置 值 


1x 24+0x* 23+ 1%«2?+1x2!+0x 2° 
a) 二 进 制 数 10110 
5x 10°+8 x 10°+0* 10?+3 x 10'+6 x 10° 
b) 十 进 制 数 58036 


图 3-4 无 符号 数 的 多 项 式 表示 


是 几 个 偶数 值 相 加 的 和 ， 因 此 一 定 是 偶数 。 另 一 方面 ， 如 果 二 进 制 数 的 1 的 位 置 的 值 是 1， 
那么 它 的 值 就 是 把 1 和 几 个 偶数 值 相 加 ， 因 此 一 定 是 奇数 。 与 在 十 进 制 中 一 样 ， 通 过 检测 1 
的 位 置 的 数字 可 以 很 容易 地 确定 一 个 二 进 制 数 是 奇数 还 是 偶数 。 

确定 十 进 制 数 等 值 的 二 进 制 数 有 点 儿 棘 手 。 一 种 方法 是 连续 地 把 这 个 数 除 以 2， 保 留 余 


数 的 记录 ， 余 数 的 逆序 就 是 这 个 二 进 制 数 。 

图 3-5 把 22 (dec) 转换 成 二 进 制 。22 
除 以 2 等 于 11, 余数 为 0， 把 余数 写 在 右 列 ， 接 着 
11 除 以 2 等 于 5 余 1。 继 续 进 行 直 到 商 为 0， 这 样 形 
成 一 个 余数 列 ， 从 下 往 上 读 取 余数 就 形成 二 进 制 数 
10110. 加 

注意 : 最 低 有 效 位 是 用 原始 数值 除 以 2 得 到 的 余 
数 ， 这 与 仅 通 过 检测 最 低 有 效 位 确定 一 个 二 进 制 数 是 
奇数 还 是 偶数 是 一 致 的 。 如 果 原 始 数 是 偶数 ， 除 以 2 
将 得 到 余数 0， 这 个 0 将 是 最 低 有 效 位 。 相 反 ， 如 果 
原始 数 是 奇数 ， 最 低 有 效 位 将 是 1。 





0 
1 
1 
0 
1 
| tan 
被 除数 


图 3-5 将 十 进 制 数 转换 为 二 进 制 数 


123 


124 
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3.1.4 无 符号 整数 的 范围 


所 有 这 些 基于 阿拉 伯 数 字 的 计数 方法 都 可 以 表示 任意 大 的 数字 。 然 而 ， 在 一 个 真实 计算 
机 中 每 个 单元 的 位 数 是 有 限 的 。 图 3-6 展示 了 一 个 7 位 的 单 
元 是 如 何 存储 数 22 (dec) 的 。 注 意 开头 的 两 个 0， 它 们 不 
影响 数值 ， 但 是 对 于 指定 内 存 位 置 的 内 容 是 必需 的 。 对 于 7 [ae el pm 
位 的 计算 机 来 说 ， 不 带 方 框 ， 这 个 数 应 该 写作 图 3-6 7 位 单元 中 的 数 22(dec) 
001 0110 
开头 的 两 个 0 仍然 是 必需 的 。 本 书 在 显示 位 串 时 ， 从 右 开 始 每 4 位 一 组 ， 组 间 有 一 个 空 
(为 了 易 读 )。 
无 符号 数值 的 范围 取决 于 一 个 单元 的 位 数 。 一 个 全 0 的 序列 代表 最 小 的 无 符号 值 ， 全 1 
的 序列 代表 最 大 的 。 
一 个 7 位 的 单元 可 以 存储 的 最 小 无 符号 整数 是 
000 0000 (bin) 
可 以 存储 的 最 大 无 符号 整数 是 
111 1111 (bin) 
最 小 的 是 0 (dec), 最 大 的 是 127 (dec), 一 个 7 位 单元 不 能 存储 大 于 127 的 无 符号 整数 。 a 


3.1.5 无 符号 加 法 


无 符号 二 进 制 数 加 法 和 无 符号 十 进 制 加 法 一 样 ， 只 不 过 更 容易 ， 因 为 只 需 学 习 2 位 加 法 
法 则 而 不 是 10 个 数字 的 加 法 法 则 。 位 加 法 法 则 是 
0+0=0 
0+1=1 
1+0=1 
1+1=10 
我 们 熟悉 的 十 进 制 中 的 进位 方法 也 一 样 适用 于 二 进 制 。 如 果 一 列 中 的 两 个 数 相 加 大 于 
1， 那 么 必须 进 1 到 下 一 列 。 
假设 有 一 个 6 位 的 单元 ， 把 01 1010 和 01 0001 两 个 数 相 加 ， 简 单 地 从 最 低 有 
效 位 列 开始 把 一 个 数 写 在 另 一 个 上 面 : 
01 1010 
ADD 01 0001 
10 1011 
注意 当 到 达 从 右 数 的 第 5 列 时 ，1+1 等 于 10， 必 须 写 0 并 进 1 到 下 一 列 ， 在 最 后 一 列 
1+0+0 得 出 和 数 中 最 左边 的 1。 
为 了 验证 这 个 进位 方法 对 二 进 制 有 效 ， 把 这 两 个 数 与 它们 的 和 都 转换 为 十 进 制 数 : 
01 1010(bin)=26(dec) 
01 0001(bin)=17(dec) 
10 1011(bin)=43(dec) 
毫 无 疑问 ， 在 十 进 制 中 ，26+17=43。 a 
这 些 例子 显示 了 进位 可 以 沿 着 连续 的 列传 递 : 
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00 0011 00 1111 

ADD 010001 ADD 001001 

01 0100 01 1000 
在 第 二 个 例子 中 ， 当 到 达 从 右 数 的 第 四 列 时 ， 有 一 个 来 自前 一 列 的 进位 ,那么 1+1+1 
等 于 11， 必 须 写 1 并 进 1 到 下 一 列 。 a 


3.1.6 ”进位 位 

前 面 例子 中 的 6 位 单元 的 表 数 范围 是 00 0000 到 111111 (bin), 或 0 到 63 (dec)。 两 个 
加 数 在 表 数 范围 内 ， 而 和 不 在 该 范围 内 是 有 可 能 的 ， 其 原因 是 和 数 太 大 了 不 能 装 进 6 位 的 存 
储 单元 。 

为 了 标记 出 这 种 情况 ，CPU 有 一 个 特殊 的 位 称 为 进位 位 (carry bit)， 以 字母 C 表示 。 当 
两 个 二 进 制 数 相 加 时 ， 如 果 最 左 列 ( 称 为 最 高 有 效 位 ) 的 和 产生 了 一 个 进位 ,那么 C 被 设置 
为 1， 否 则 C 为 0。 换 名 话说 ，C 总 是 包含 单元 最 左 列 产生 的 进位 。 在 前 面 所 有 的 例子 中 ， 
和 都 在 表 数 范围 内 ， 所 以 进位 位 为 0。 

这 里 有 两 个 展示 进位 位 影响 的 例子 : 

01 0110 10 1010 
ADD 100010 ADD 01 1010 
C=0 111000 C=1 000100 

在 第 二 个 例子 中 ，CPU 进行 42+26 的 运算 ， 正 确 的 结果 是 68， 但 它 太 大 不 能 装 进 6 位 
的 单元 中 。 注 意 6 位 单元 的 表 数 范围 是 0 到 63， 因 此 只 能 存储 最 右 的 6 位 ,得 到 不 正确 的 
结果 4， 而 进位 位 也 被 设置 为 1， 表示 最 左 一 列 有 进位 。 四 


3.2 ”二进制 补 码 表示 


无 符号 二 进 制 表 示 法 仅 适 用 于 非 负 整数 。 如 果 计 算 机 要 处 理 负 整数 ， 那 么 它 必 须要 用 一 
种 不 同 的 表示 法 。 

假设 有 一 个 6 位 的 单元 要 存储 -5 ( dec)。 因 为 5 (dec) 是 101 (bin)， 所 以 你 可 能 想到 
图 3-7 所 示 的 样子 。 但 这 是 不 可 能 的 ， 因 为 包括 首位 在 内 


的 所 有 位 都 必须 是 0 或 1。 谨 记 计 算 机 是 二 进 制 的 。 上 面 
这 种 存储 值 要 求 每 个 方 框 可 以 存储 0 或 1 或 破 折 号 ， 这样 tetela 
的 计算 机 必须 是 三 进 制 而 不 是 二 进 制 。 图 3-7 ”尝试 用 二 进 制 存储 负数 


解决 这 个 问题 的 办 法 是 保留 单元 的 第 一 个 方 框 来 表示 
符号 。 这 样 ，6 位 单元 将 分 为 两 个 部 分 一 一 1 位 符号 位 和 5 位 数值 位 ， 如 图 3-8 所 示 。 因 为 
符号 位 必须 是 0 或 1， 所 以 一 种 可 能 是 让 符号 位 0 表示 正 数 ， 符 号 位 1 表示 负数 。 那 么 +5 


可 以 表示 为 : 
00 0101 

-5 可 以 表示 为 : OTOT 
10 0101 iy 
在 这 种 表示 法 中 ，+5 和 -5 的 数值 位 是 相同 的 ， 仅 仅 t with 

是 符号 位 不 同 。 符号 位 


然而 ， 很 少 有 计算 机 用 前 面 这 种 编码 ， 因 为 如 果 进 图 3-8 有 符号 整数 的 结构 
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行 十 进 制 的 +5 加 -5$， 得 到 0， 但 如 果 进 行 二 进 制 的 00 0101 加 10 0101 (符号 位 和 所 有 )， 
得 到 
00 0101 
ADD 100101 
C=0 10 1010 
这 显然 不 等 于 0。 如 果 CPU 硬件 可 以 用 无 符号 二 进 制 加 法 的 普通 算法 对 包含 符号 位 的 
完整 数字 +5 和 -5 进行 相 加 并 得 到 0， 这 会 更 加 方便 。 
二 进 制 补 码 (two’s complement) 表示 有 这 个 特性 ， 正 数 由 符号 位 0 和 与 无 符号 二 进 制 
表示 一 样 的 数值 位 组 成 。 例 如 ， 十 进 制 +5 (dec) 仍然 表示 为 00 0101. 
但 是 -5 (dec) 的 表示 不 是 10 0101， 而 是 11 1011， 这 样 +S 加 -5 就 得 到 
00 0101 
ADD 111011 
C=1 00 0000 
注意 6 位 的 和 都 是 0， 和 我 们 期 望 的 一 样 。 
按照 6 位 单元 的 二 进 制 加 法 法 则 ，11 1011 称 为 00 0101 的 加 法 逆 元 (additive reverse). 
求 加 法 逆 元 的 运算 称 为 求 补 (negation)， 缩 写 为 NEG。 对 一 个 数 求 补 也 称 为 取 它 的 补 码 。 
现在 我 们 所 需 的 是 求 一 个 数 补 码 的 法 则 。 有 个 简单 的 法 则 是 基于 反 码 (ones” 
complement)， 反 码 是 把 所 有 的 1 变 为 0，0 变 为 1 的 二 进 制 序 列 。 反 码 也 称 为 NOT 运算。 
假设 一 个 6 位 单元 ，00 0101 的 反 码 是 
NOT 00 0101=11 1010 加 
找 出 补 码 法 则 的 线索 是 把 一 个 数 和 它 的 二 进 制 反 码 相 加 的 结果 。 因 为 1 加 0 等 于 1, 0 
加 1 等 于 1， 所 以 任意 数 和 它 的 反 码 相 加 将 生成 一 个 全 1 的 序列 ， 然 而 把 一 个 单独 的 1 和 全 
1 的 数 相 加 就 会 得 到 一 个 全 0 的 数 。 
00 0101 加 上 它 的 反 码 


00 0101 
ADD 11 1010 
C=0 11 1111 
得 到 是 全 1， 再 把 这 个 数 加 1 得 到 
11 1111 
ADD 000001 
C=1 000000 
这 个 数 是 全 0 的 。 a 


换 名 话说 ， 把 一 个 数 加 上 它 的 反 码 ， 再 加 1 就 得 到 全 0 的 数 ， 因 此 一 个 二 进 制 数 的 反 码 
加 1 一 定 是 它 的 补 码 。 
将 00 0101 的 反 码 加 1 得 到 它 的 补 码 。 
NOT 00 0101=11 1010 
11 1010 
ADD 00 0001 

11 1011 

因此 ，00 0101 的 补 码 是 11 1011， 即 
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NEG 00 0101=11 1011 
11 1011 的 确 是 000101 的 负数 ， 因 为 如 前 所 示 两 者 相 加 为 0。 m [127 
不 管 一 个 数 有 多 少 位 ， 对 一 个 数 求 补 的 一 般 法 则 是 : 
e 一 个 数 的 补 码 等 于 它 的 反 码 加 1。 
或 者 用 NEG 和 NOT 运算 表示 为 
® NEG x=1+NOT x 
在 我 们 熟悉 的 十 进 制 中 ， 如 果 对 一 个 负数 值 取 负 ， 那 么 将 得 到 一 个 正 值 ， 代 数 表 达 式 为 
—(—x)=* 
这 里 x 为 正 值 。 如 果 求 补 码 的 法 则 是 有 效 的 ， 那么 一 个 负数 值 的 补 码 应 该 是 相应 的 正 值 。 
如 果 对 -5 (dec) 取 补 码 会 怎样 ? 
NOT 11 1011=00 0100 


00 0100 
ADD 000001 
00 0101 
RE! 如 你 所 期 望 的 ， 又 得 到 了 +5 (dec). a 
3.2.1 补 码 的 表 数 范围 
单元 能 表示 的 整数 范围 是 多 少 ? -7 1001 
数值 最 大 的 正 整数 是 0111 (bin)， 即 +7 ( dec)。 这 和 = 1010 
在 无 符号 二 进 制 数 中 最 大 值 为 1111 不 同 ， 因 为 第 一 位 被 -Or ERG 
保留 作为 符号 位 且 一 定 是 0。 在 无 符号 二 进 制 中 , 用 4 位 -3 1101 
单元 可 以 存储 的 最 大 数 是 +15 (dec), BRA 4 位 都 用 于 存 — 
储 数值 。 在 补 码 表示 中 ， 能 存储 的 最 大 数 只 是 +7 (dec), 
因为 仅 有 3 位 用 于 数值 。 图 3-9 4 位 单元 中 取 补 码 的 结果 
数值 最 大 的 负 整 数 是 什么 呢 ? 这 个 问题 的 答案 可 能 十进制 ” 二进制 
不 太 显 而 易 见 。 图 3-9 展示 了 最 大 到 7 的 每 个 正 整数 的 补 -8 1000 
码 ， 在 图 中 看 到 了 什么 规律 没有 ? 7 r 
我 们 注意 到 补 码 运算 自动 在 负 整数 的 符号 位 生成 了 一 2. ge 
个 1， 它 本 来 就 应 该 这 样 。 偶 数 仍然 以 0 结尾， 奇数 仍然 -4 1100 
Wo 结 结尾 。 REE 1 1101 
而 且 ， 如 你 所 期 望 的 ， 二 进 制 -6 加 1 得 到 -5， 类 似 A ees 
地 ， 二 进 制 -7 加 1 得 到 -6。 我 们 可 以 从 4 位 挤 出 一 个 更 0 0000 128 
大 的 负 整数 -8。 二 进 制 -8 加 1 得 到 -7， 因 此 -8 应 该 用 . aes 
1000 表示 。 图 3-10 是 一 个 4 位 存储 单元 的 完整 有 符号 整 3 0011 
数 表 。 4 0100 
(dec) 有 一 个 其 他 负 整 数 没有 的 属性 ， 如 果 取 -7 AG 
dies 得 到 +7， 如 下 所 示 : 7 oll 


NOT 1001=0100 图 3-10 4 位 单元 的 有 符号 整数 
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0100 
ADD 0001 
0111 
但 如 果 取 -8 的 补 码 ， 得 到 的 还 是 -8: 
NOT 1000=0111 
0111 
ADD 0001 
1000 
因为 4 位 无 法 表示 +8。 
我 们 已 经 确定 了 4 位 单元 的 二 进 制 补 码 表 数 范围 以 二 进 制 表示 是 1000 到 0111， 或 者 以 
十 进 制 表达 是 -8 到 +7。 
不 管 单元 包含 多 少 位 ， 模 式 都 是 一 样 的 。 最 大 的 正 整 数 是 一 个 0 后 面 全 是 1， 而 数值 最 
大 的 负 整 数 是 一 个 1 后 面 全 是 0， 它 的 数值 比 最 大 正 整数 大 1。-1 (dec) 用 全 1 表示 。 
6 位 补 码 表示 的 表 数 范围 ， 用 二 进 制 表示 是 
10 0000 到 01 1111 
或 者 十 进 制 表 示 是 
-32 到 31 
和 其 他 的 负 整数 不 同 ，10 0000 的 补 码 就 是 它 自己 10 0000。 还 可 以 看 到 -1 (dec) = 11 1111 
(bin). a 


3.2.2 ”基数 转换 
把 一 个 负数 从 十 进 制 转换 为 二 进 制 分 为 两 步 。 首先 ， 把 它 的 数值 部 分 当 作 无 符号 表示 转 
换 为 二 进 制 ; 其 次 ， 按 照 补 码 的 方式 对 它 取 反 。 
-7 (dec) 如 何 存储 在 10 位 单元 中 ? 首先 ， 写 出 +7 的 二 进 制 数值 
+7 (dec)=00 0000 0111 (bin) 


然后 ， 取 其 补 码 。 
NOT 00 00000111=11 1111 10000 
11 1111 1000 
ADD 00 0000 0001 
11 1111 1001 
则 有 -7 (dec) X 111111 1001 (bin). a 


在 采用 补 码 表示 的 计算 机 中 ， 把 一 个 数 从 二 进 制 转换 成 十 进 制 ， 总 是 首先 检测 符号 位 。 
如 果 是 0， 这 个 数 是 正 数 ， 可 以 按照 无 符号 数 表示 进行 转换 ; 如 果 是 1， 这 个 数 是 负数 ， 可 
选 的 方法 有 两 种 。 一 种 是 通过 取 反 得 到 正 数 ， 然 后 再 按照 无 符号 数 表示 的 法 则 ， 把 它 转换 成 
十 进 制 。 
Fees 一 个 10 位 单元 的 内 容 为 11 1101 1010， 它 代表 的 十 进 制 数 是 什么 ”符号 位 是 
1， 因 此 这 个 数 是 负数 ， 首 先 对 这 个 数 取 反 : 
NOT 11 1101 1010=00 0010 0101 
00 0010 0101 
ADD 00 0000 0001 
00 0010 0110 
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00 0010 0110 (bin) =32+4+2=38 (dec) 
因此 原始 的 二 进 制 数 一 定 是 38 的 负 值 ， 即 
11 1101 1010 (bin) =-38 (dec) a 
另 一 种 方法 是 不 用 取 补 码 ， 直 接 转 换 ， 即 只 用 将 原始 二 进 制 数 中 为 0 的 那些 位 的 位 置 值 
相 加 ， 再 加 1。 这 个 方法 是 正确 的 ， 因 为 取 正 整数 补 码 的 第 一 步 就 是 按 位 取 反 。 那 些 本 来 对 
正 整 数 数值 有 贡献 的 1 变 为 了 0， 所 以 是 0 而 不 是 1 对 负 整 数 的 数值 有 贡献 。 
图 3-11 显示 的 是 11 1101 1010 (bin) 的 为 0 的 位 置 ， 把 这 些 位 的 位 置 值 之 和 
加 1 得 到 
1101 1010 (bin) =-(1+32+4+1D)=-38 (dec) 
这 和 前 面 方法 得 到 的 结果 是 一 样 的 。 2 


= 1 的 位 置 

4 的 位 置 

32 的 位 置 

图 3-11 111101 1010 (bin) 中 所 有 0 的 位 置 值 


3.2.3 Aah 


看 待 二 进 制 表示 的 另 一 种 方法 是 使 用 数 
轴 。 图 3-12 展示 了 3 位 单元 的 无 符号 二 进 000 001 O10 O11 100 101 110 10 
制 表示 的 数 轴 ， 能 够 表示 8 个 数字 。 


可 以 通过 在 数 轴 上 往 右 移动 进行 加 法 运 0 1 2 3 4 5 6 7 
算 。 例 如 ,4 加 3， 从 4 开始 往 右 移动 3 个 位 图 3-12 3 位 无 符号 系统 的 数 轴 


置 得 到 7。 如 果 尝 试 在 数 轴 上 6 加 3， 将 超出 
最 右 端 。 如 果 用 二 进 制 进行 这 个 加 法 ,将 得 | | | | 


到 不 正确 的 结果 ， 因 为 结果 超出 了 范围 : 0 1 2 3 4 5_6 7 
ain {一 一 一 一 | | 


ADD 001 a) 把 数 轴 从 中 间断 开 
C=1 001 
把 无 符号 数 轴 在 3 和 4 之 间断 开 ， 把 右 100 101 110 111 000 001 010 Oli 
半 部 分 移 到 左边 ， 这 样 可 以 得 到 补 码 的 数 3 131 
Hi, Fl 3-13 显示 了 二 进 制 数 111 现在 和 000 b) 把 右边 的 部 分 移 到 左边 


相 邻 ， 之 前 是 +7 (dec)， 现 在 是 -1 (dec). 
即使 有 经 过 0， 加 法 仍然 是 通过 在 数 轴 
上 疝 右 移动 来 进行 的 。-2 加 3， 从 -2 开始 
向 右 移动 3 个 位 置 得 到 1。 如 果 用 二 进 制 计算 ， 答 案 在 范围 内 ， 因 此 是 正确 的 : 
110 
ADD 011 
C=1 001 


这 些 位 和 无 符号 二 进 制 6 加 3 是 一 样 的 。 我 们 注意 到 结果 虽然 在 表 数 范围 内 ， 但 是 进位 


图 3-13 3 位 补 码 系统 的 数 轴 


86 ZY HERRA (B 3 ZB) 


位 是 1。 在 补 码 表示 中 ， 进 位 位 不 再 表示 加 法 的 结果 是 否 是 在 范围 内 。 
有 了 时候， 只 考虑 移动 后 的 十 进 制 数 轴 ， 可 
以 完全 避免 二 进 制 表示 。 3-14 展示 了 补 码 数 4 5 6 7 0 1 2 3 
轴 ， 用 等 值 的 无 符号 十 进 制 数 代替 二 进 制 数 。 || E+ t+ ++" +H 
这 个 例子 中 ,每 个 存储 位 置 有 3 位 ， 因 此 最 多 
有 23 或 8 个 数 。 图 3-14 无 符号 十 进 制 数 的 补 码 数 轴 
现在 ， 从 0 到 3 的 无 符号 数 与 有 符号 数 是 
一 样 的 。 此 外 ， 通 过 减 8 可 以 从 无 符号 数 得 到 有 符号 负数 : 
7-8=-1 
6-8=-2 
5-8=-3 
4-8=-4 
GEED 假定 有 一 个 8 位 单元 A 2 wt 256 个 可 能 的 整数 值 ， 非 负数 从 0 到 127. i 
设 采用 二 进 制 补 码 表示 ，97 加 45 等 于 多 少 ? 以 无 符号 二 进 制 数 计算 ， 和 等 于 
97+45=142 (dec， 无 符号 ) 
但 用 在 补 码 表示 中 ， 这 个 和 为 
142-256=-114 (dec， 有 符号 ) 
注意 ， 这 样 的 结果 完全 避免 了 二 进 制 表示 。 为 了 验证 结果 ， 首 先 把 97 和 45 转换 为 二 进 
制 并 相 加 : 
97 (dec) = 0110 0001 (bin) 
45 (dec) = 0010 1101 (bin) 
0110 0001 
ADD 00101101 
C=1 1000 1110 
符号 位 是 1， 因此 这 是 一 个 负数 。 现 在 ， 确 定 它 的 数值 大 小 
NEG 1000 1110=0111 0010 (bin) 
=114 (dec) 
得 出 预期 的 结果 。 


3.2.4 ”溢出 位 


在 ISA3 层 上 二 进 制 存储 的 一 个 重要 特性 就 是 每 个 值 都 没有 与 之 相关 的 类 型 。 在 前 面 的 
例子 中 ， 和 数 1000 1110 作为 无 符号 数 解 释 时 ， 它 是 142 ( dec)， 但 作为 补 码 表示 解释 时 ， 
它 就 是 -114 (dec)。 尽 管 位 模式 的 值 取决 于 它 的 类 型 ， 是 无 符号 还 是 补 码 ， 但 是 硬件 对 两 
种 类 型 不 加 以 区 分 ， 只 存储 位 模式 。 

当 CPU 对 两 个 存储 单元 的 内 容 相 加 时 ， 它 不 管 它们 的 类 型 ， 只 采用 位 序列 上 的 二 进 制 
加 法 法 则 。 对 于 无 符号 二 进 制 ， 如 果 和 数 超出 表 数 范围 ， 硬 件 只 是 简单 存储 (不 正确 的 ) 结 
果 ， 相 应 地 设置 C 位 并 继续 往 下 走 。 由 软件 来 检测 相 加 后 的 C 位， 看 是 否 在 最 高 位 的 那 一 
列 有 进位 发 生 ， 并 按 需 采取 适当 的 动作 。 

我 们 前 面 说 过 ， 在 二 进 制 补 码 表示 中 ， 进 位 位 不 再 表示 一 个 和 是 否 在 表 数 范围 内 。 当 运 
算 结 果 超 出 表 数 范围 时 ,我们 称 为 出 现 了 溢出 情况 (overflow condition )。 为 了 为 有 符号 数 


标示 这 种 情况 ，CPU 中 有 另 一 个 用 V 表示 的 特殊 位 ， 叫 作 溢 出 位 ( overflow bit). “4 CPU 
对 两 个 二 进 制 整数 相 加 时 ， 如 果 和 超出 补 码 表示 的 范围 ,那么 V 设置 为 1， 否则 V 设置 
为 0。 

不 论 以 何 种 方式 解读 位 模式 ，CPU 总 是 执行 同样 的 加 法 运算 。 与 C 位 一 样 ， 如 果 发 生 
了 补 码 溢出 ，CPU 不 会 停 下 来 ， 它 将 V 位 设置 为 1， 并 继续 它 的 下 一 步 工 作 。 由 软件 来 检 
测 加 法 后 的 V 位 。 

这 里 有 几 个 6 位 单元 的 例子 ， 展 示 了 进位 位 和 溢出 位 的 情况 : 

00 0011 01 0110 

ADD 01 0101 ADD 00 1100 





两 个 正 数 相 加 ;: 
V=0 011000 V=1 100010 
C=0 C=0 
00 0101 00 1000 
-Arg ADD 10I ADD 111010 
个 负数 相 加 :  V=0 111100 V=0 000010 
C=0 C=1 
11 1010 100110 
ADD 110111 ADD 100010 
ENARA: GZO 110001 V=1 001000 
C=] C=1 
注意 V 和 C 的 值 有 可 能 是 所 有 的 组 合 。 m 


怎样 才能 知道 发 生 了 洲 出 情况 呢 ? 一 种 方法 是 把 两 个 数 转换 到 十 进 制 ， 两 者 相 加 看 它们 
的 和 是 否 超出 了 以 十 进 制 表示 的 范围 。 如 果 是 ， 那 就 是 发 生 了 溢出 。 

硬件 通过 将 符号 位 的 进位 与 C 位 比较 来 检测 是 否 溢出 发 生 : 如 果 两 者 不 同 ， 滋 出 发 生 ， 
V 为 1; 如 果 两 者 相同 ，V 为 0。 

不 将 符号 位 的 进位 与 C 位 比较 ， 也 可 以 通过 查看 加 数 与 和 的 符号 ， 直 接 确定 是 否 发 生 
了 溢出 。 如 果 两 个 正 数 相 加 得 到 负数 或 者 两 个 负数 相 加 得 到 正 数 ， 那 么 就 发 生 了 溢出 ; 一 个 
正 数 和 一 个 负数 相 加 是 不 可 能 发 生 溢 出 的 。 


3.2.5 ”负数 和 零 位 


除了 检测 无 符号 整数 溢出 情况 的 C 位 和 检测 有 符号 整数 溢出 情况 的 V 位 外 ，CPU 还 维 
护 了 另外 两 位 ， 供 软件 在 运算 后 进行 检测 。 它 们 是 N 位 和 Z 位 : N 位 用 于 检测 负数 结果 ，Z 
位 用 于 检测 零 结果 。 总 的 来 说 ， 这 4 个 状态 位 的 函数 是 : 
e N=1， 如 果 结 果 是 负数 。 
N=0， 其 他 情况 。 
e Z=1， 如 果 结 果 全 是 零 。 
Z=0， 其 他 情况 。 
e V=1， 如 果 有 符号 整数 溢出 发 生 。 
V=0， 其 他 情况 。 
e C=1， 如 果 无 符号 整数 溢出 发 生 。 
C=0， 其 他 情况 。 
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由 于 NN 位 是 符号 位 的 一 个 副本 ， 所 以 硬件 很 容易 确定 它 。 而 要 确定 Z 位 ， 硬 件 则 要 费 
点 儿 工 夫 ， 因 为 它 必 须 确定 结果 的 每 个 位 是 否 痢 为 0。 第 10 章 展示 了 硬件 怎样 根据 结果 计 


算 状态 位 。 
这 里 有 三 个 加 法 例子 ， 展 示 了 结果 的 4 个 状态 位 情况 。 

01 0110 00 1000 00 1101 

ADD 00 1100 ADD 11 1010 ADD 11 0011 

N=1 100010 N=0 000010 N=0 00 0000 

Z=0 Z=0 Z=1 

V=1 V=0 V=0 

C=0 C=] C=] 8 


135 C 语言 和 其 他 大 多 数 HOL6 层 语 言 默 认 会 在 整数 溢出 时 忽略 V 位 。 图 3-15 给 出 了 一 个 
程序 ， 使 用 limits.h 库 头 文件 中 的 INT_MAX， 将 
n 的 值 初始 化 为 比 其 最 大 值 小 2。 该 程序 执行 6 次 
循环 ， 每 次 n 都 递增 ps, 输出 执行 结果 的 计算 机 用 #include <stdio.h> 
16 位 单元 存储 整数 ， 因 此 ， 其 补 码 范围 为 -2 147 #include <limits.h> 


483 648 ~ 2 147 483 647 (十 进 制 )， 或 1000 0000 int main() { 
0000 0000 ~ O111 1111 1111 1111 (二 进 制 )。 当 程 a eee A 

re i i for (int i = 0; i < 6; i++) { 
序 将 最 大 值 加 1 时, C 位 等 于 0，V 位 等 于 1。 洲 printf ("n == $d\n", n); 


出 发 生 ， 但 程序 仍然 继续 执行 ， 并 把 不 正确 的 和 ney 
数 1000 0000 0000 0000 解释 为 一 个 负数 。6.2 市 } 
将 说 明 在 Asmb5 层 如 何 测试 Vy 位 。 
3.3 二进制 运算 

因为 计算 机 中 所 有 信息 都 是 以 二 进 制 形式 存 
储 的 ， 所 以 CPU 就 用 二 进 制 运算 来 处 理 这 些 信 
息 。 前 面 章节 提 到 了 NOT、ADD 和 NEG 这 些 二 
进 制 运算 : NOT 是 逻辑 运算 符 ' ADD A NEG 是 
算术 运算 符 。 本 节 我 们 再 讲 一 些 其 他 的 在 计算 机 图 3.15 C 程序 中 的 整数 溢出 

CPU 中 可 用 的 逻辑 和 算术 运算 符 。 


3.3.1 逻辑 运算 符 


我 们 熟悉 逻辑 运算 AND 和 OR。 另 一 个 逻辑 运算 符 是 异 或 ， 写 作 XOR。 若 p 为 真 ， 或 
者 q 为 真 ， 但 不 同时 为 真 ， 那么 p 和 qd 的 异 或 逻辑 值 为 真 。 即 , p 一 定 真 异 于 q, 或 者 q 必 
须 真 异 于 po 

二 进 制 数字 一 个 有 趣 的 属性 是 可 以 把 它们 作为 逻辑 值 来 解读 。 在 ISA3 层 ， 位 为 1 表示 
真 ， 位 为 0 表示 假 。 图 3-16 展示 了 AND, OR 和 XOR 运算 符 在 ISA3 层 的 真 值 表 。 

在 HOL6 层 ，AND 和 OR 对 值 为 真 或 假 的 布尔 表达 式 进 行 运算 ， 用 在 让 语句 和 循环 中 
来 测试 控制 语句 执行 的 条 件 。 下 面 的 C 语句 是 AND 运算 符 的 一 个 例子 


if ((ch s= ta!) && (ch <= 'z')) 


return 0; 
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BIE 信息 的 表示 


Pp a p AND q Pp gq p OR Gq p q p XOR q 
0 0 0 0 0 0 0 0 0 
Lp | 0 ere 1 Om i 1 
1 0 0 1 p 1 1 0 1 
j EET 1 Hdi 1 iuti 0 
a) ISA3 AY AND 真 值 表 b) ISA3 层 的 OR 真 值 表 c) ISA3 层 的 XOR 真 值 表 


图 3-16 ISA3 层 上 AND、OR 和 XOR 运算 符 的 真 值 表 


图 3-17 Æ AND, OR 和 XOR 在 HOL6 层 的 真 值 表 ， 它 和 图 3-16 是 一 样 的 ，ISA3 层 的 


1 对 应 HOL6 JAW true ( 真 )，ISA3 层 的 0 对 应 HOL6 JAAS false ( 假 )。 


pq op AND q pak RY eS pq p XOR q 
true true true true true true true true false 
true false false true false true true false true 
false true false false true true false true true 
false false false false false false false false false 
a) HOL6 层 的 AND 真 值 表 b) HOL6 层 的 OR 真 值 表 c) HOL6 层 的 XOR 真 值 表 


图 3-17 HOL6 层 上 AND, OR 和 XOR 运算 符 的 真 值 表 


由 于 不 涉及 进位 ， 所 以 逻辑 运算 比 加 法 更 容易 执行 。 对 序列 中 的 对 应 位 进行 逐 位 运算 。 


逻辑 运算 对 进位 位 和 溢出 位 都 没有 影响 。 
一 些 6 位 单元 的 例子 是 
01 1010 01 1010 01 1010 
ADD 010001 OR 010001 XOR 010001 
N=0 010000 N=0 011011 N=0 001011 
=0 Z=0 Z=0 
注意 ， 如 果 把 1 与 1 做 AND 运算 ， 结 果 是 1， 没 有 进位 。 


每 个 AND、OR 和 XOR 运算 用 两 组 位 来 产生 结果 ,不 过 NOT Ail NEG 运算 仅 对 一 组 位 


进行 ， 因 此 称 为 一 元 运算 (unary operation ) 。 


3.3.2 ”寄存 器 传送 语言 


寄存 器 传送 语言 (RTL) 的 目的 是 精确 指 o 
定 硬 件 运算 的 结果 。 如 果 学 习 过 逻辑 学 ， 你 会 a 
熟悉 RTL 符号 。 图 3-18 展示 了 RTL 符号 。 XOR 

在 逻辑 学 中 ，AND 和 OR 运算 称 为 合 取 
(conjunction) 和 析 取 (disjunction)，NOT 运 Implies 
算 符 称 为 否定 (negation), 4A (imply) 运算 Transfer 
符 可 以 翻译 为 英语 “if/then ” (中 文 “如 果 / 那 Bit index 
4”), 传递 (transfer) 运算 符 是 与 C 中 赋值 运 Informal description 


算 符 = 等 效 的 硬件 运算 符 。 运 算 符 左边 的 内 存 Sequential separator 
单元 获得 运算 符 右 边 的 量 。 位 索引 运算 符 把 内 Concurrent separator 


存单 元 当做 数组 ， 最 左边 的 位 是 索引 0, C 图 3-18 寄存 器 传送 语言 的 运算 及 其 符号 表示 
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索引 数组 元 素 一 样 。 当 形式 化 描述 不 够 时 ， 可 以 用 非 形式 化 的 语言 描述 ， 用 大 括号 括 起 来 。 

有 两 种 分 隔 符 : 一 个 是 顺序 分 隔 符 (sequential separator) (分 号 )， 用 来 分 隔 一 个 接 一 个 
发 生 的 两 个 动作 ; 另 一 个 是 并 发 分 隔 符 (concurrent separator)( 逗号 ) 用 来 分 隔 同时 发 生 的 两 
个 动作 。 

GEED 在 例 3.19 的 第 3 个 计算 中 ,假设 第 一 个 6 位 单元 用 a 表示， 第 二 个 6 位 单元 
用 4b 表示 ,结果 为 c<， 那么 XOR 运算 的 RTL 描述 是 

c+a@®b;N+c<0,Z+ c0 

首先 ，c 获得 a 和 4b 的 异 或 ， 这 个 动作 完成 后 ， 下 面 这 两 个 动作 同时 发 生 : N 获得 一 个 

布尔 值 ，Z 获得 一 个 布尔 值 。 当 ec < 0 时 , 布尔 表达 式 c 二 0 为 1， 否则 为 0。 = 


3.3.3 ”算术 运算 符 
另外 还 有 两 个 一 元 运算 符 : ASL 表示 算术 左 移 
(arithmetic shift left) 和 ASR 表示 算术 右 移 (arithmetic C 
shift right) 。 如 同 ASL 这 个 名 字 暗 示 的 ， 单 元 中 每 位 -EEEE o 
往 左 移动 一 个 位 置 ， 最 左边 的 位 移动 到 进位 位 ， 而 最 图 3-19 6 位 单元 的 ASL 运算 的 行为 
右边 的 位 得 到 0。 图 3-19 展示 了 一 个 6 位 单元 的 ASL 
运算 的 行为 。 
下 面 是 3 个 算术 左 移 运算 的 例子 。 
ASL 11 1100=11 1000, N=1, Z=0, V=0, C=1 
ASL 00 0011=00 0110, N=0, Z=0, V=0, C=0 
ASL 01 0110=10 1100, N=1, Z=0, V=1, C=0 m 
这 个 运算 称 为 算术 移 位 ， 因 为 当 这 些 位 用 作 整 数 表示 时 ， 它 的 结果 类 似 于 算术 操作 。 假 
设 用 无 符号 二 进 制 表 示 ， 前 面 例子 中 3 个 整数 在 移动 前 是 
60 3 22 (dec, 无 符号 ) 
移动 后 成 为 
56 6 44 (dec, 无 符号 ) 
ASL 的 结果 是 原 数 的 2 倍 。 因 为 120 超出 6 位 单元 能 表示 的 整数 范围 ， 所 以 ASL 不 能 
把 60 翻 倍 。 当 把 二 进 制 序列 看 作 无 符号 整数 时 ， 如 果 移 动 后 进位 位 是 1， 则 发 生 溢 出 。 
在 十 进 制 中 ,， 左 移 产生 同 样 的 结果 ， 只 是 整数 被 乘 以 10 而 不 是 2。 例如， 对 356 进行 
十 进 制 的 ASL 会 得 到 3560， 它 是 原 数值 的 10 倍 。 
如 果 把 数 解释 为 补 码 表示 会 是 什么 情况 呢 ? 那么 移动 前 3 个 整数 是 
-4 3 22 (dec， 有 符号 ) 
移动 后 成 为 
-8 6 一 20 (dec， 有 符号 ) 
同样 ， 尽 管 是 负数 ，ASL 的 结果 仍然 是 原 数 的 2 倍 。 这 次 ，ASL 不 能 把 22 翻 倍 ， 假 定 
用 补 码 表示 ，44 就 超出 了 范围 。 这 个 溢出 情况 使 得 V 位 被 设置 为 1。 这 个 情形 与 加 法 运算 
中 C 位 检测 到 无 符号 值 溢出 相似 ， 需 要 用 V 位 来 检测 有 符号 值 的 溢出 。 
Xt 6 位 单元 r 进 行 算 术 左 移 的 RTL 描述 为 
Cr (0) r (0.4) 1 (1.5) ,r <5) —0; 
N = r<0 , Z + r=0, V + {overflow} 
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同时 ，C 获得 r 最 左边 的 位 ，r 最 左边 的 5 位 直接 获得 它们 紧邻 着 的 右边 位 的 值 ， 最 右 
边 一 位 获得 0。 移 位 之 后 ， 根 据 r 的 新 值 设置 状态 位 N、Z 和 V。 区 分 分 号 和 逗号 是 很 重要 
的 : 分 号 隔 开 两 个 事件 ， 每 个 事件 有 3 个 部 分 ; 在 每 个 部 分 内 ， 逗 号 隔 开 同 时 发 生 的 事件 。 
大 括号 非 形式 化 地 表示 当 把 值 看 作 有 符号 整数 时 ， 根 据 结 果 是 否 溢出 对 V 位 进行 设置 。 
在 ASR 运 算 中 ,组 中 每 个 位 往 右 移动 一 个 位 
置 ， 最 低 有 效 位 移 到 进位 位 ， 最 高 有 效 位 保持 不 变 。 





| 
图 3-20 展示 了 一 个 6 位 单元 的 ASR 运算 的 动作 。ASR rr 
运算 不 会 影响 V 位 ， 因 为 一 个 数 除 以 2 时 不 会 发 生 
溢出 。 图 3-20 6 位 单元 的 ASR 运算 的 行为 


下 面 是 4 个 算术 右 移 的 例子 。 
ASR 01 0100=00 1010, N=0, Z=0, C=0 
ASR 01 0111=00 1011, N=0, Z=0, C=1 
ASR 11 0010=11 1001, N=1, Z=0, C=0 
ASR 11 0101=11 1010, N=1, Z=0, C=1 a 
ASR 运算 是 特意 为 补 码 表示 设计 的 ， 因 为 符号 位 保持 不 变 ， 负 数 仍然 是 负数 ， 正 数 仍然 是 
正 数 。 
往 左 移 1 位 是 原 数 乘 以 2， 反之 往 右 移 1 位 是 原 数 除 以 2。 在 前 面 例子 中 ， 移 动 前 4 个 
整数 为 


20 23 -14 =11 (dec， 有 符号 ) 
移动 后 是 
10 11 -7 -6 (dec， 有 符号 ) 


偶数 正好 可 以 被 2 整除 ， 因 此 ASR 对 它们 的 结果 没什么 疑问 。 当 奇数 除 以 2 时 ,结果 总 是 
向 下 取 整 。 例 如 ,23 = 2=11.5,11.5 向 下 取 整 为 11， 同样, 一 11 + 2=-5.5,-5.5 向 下 取 整 为 -6。 
注意 ， 因 为 在 数 轴 上 -6 在 -5.5 左边 ， 因 此 它 小 于 -5.5。 


3.3.4 ”循环 移 位 运算 符 

和 算术 运算 符 相 比 ， 循 环 移 位 运算 符 不 会 把 二 进 制 序列 看 作 整 数 ， 因 此 循环 移 位 运算 
不 会 影响 N、Z 和 V 位 ， 而 只 会 影响 C 位 。 有 两 种 循环 移 位 运算 符 : 表示 为 ROL 的 循环 左 
移 和 表示 为 ROR 循环 右 移 。 图 3-21 展示 了 6 位 单元 的 循环 移 位 运算 符 的 行为 。 循 环 左 移 类 
似 于 算术 左 移 ， 在 循环 左 移 中 C 位 会 循环 移 到 单元 的 最 右边 位 ， 而 在 算数 右 移 中 该 位 是 补 0 
的 。 循环 右 移 是 在 相反 的 方向 做 同样 的 事情 。 


{EEEE  -O-GEEEEH 


a) 循环 左 移 运算 符 b) 循环 右 移 运算 符 
图 3-21 循环 移 位 运算 符 的 行为 
6 位 单元 循环 左 移 的 RTL 描述 是 


Cr (0) ,r (0.4) +r (1.5) ,7 (5) —C 
尽管 进位 位 是 ISA3 层 上 唯一 受 循 环 左 移 影响 的 状态 位 ， 但 在 Mc2 层 上 V 位 也 会 受到 
影响 (将 在 第 10 章 讨 论 )。 
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下 面 是 4 个 循环 移 位 运算 的 例子 。 
C=1, ROL 01 1101=11 1011, C=0 
C=0, ROL 01 1101=11 1010, C=0 
C=1, ROR 01 1101=10 1110, C=1 
C=0, ROR 01 1101=00 1110, C=1 
左边 是 循环 移 位 前 的 C 值 ， 而 右边 是 循环 移 位 后 的 C 值 。 = 


3.4 十 六 进 制 与 字符 表示 


前 面 章 节 中 的 二 进 制 表示 是 整数 表示 ， 本 节 介 绍 另 一 种 基数 ， 将 用 于 下 一 章 中 介绍 的 计 
算 机 。 本 章 还 将 介绍 这 种 计算 机 是 如 何 存储 字母 信息 的 。 


3.4.1 十 六 进 制 

假定 一 个 人 有 16 根 手指 而 不 是 10 根 。 那 么 发 明 阿拉 伯 数 字 时 ， 会 发 生 什 么 情况 呢 ? 记 
得 10 根 手指 模式 是 从 0 开始 ， 一直 继续 发 明 新 的 符号 1、2， 直 到 倒数 第 二 根 手 指 9， 接 着 
在 最 后 一 根 手 指 ， 把 1 和 0 结合 在 一 起 表示 下 一 个 数 10。 

如 果 是 16 根 手指 ， 当 达到 9 时 ， 仍 然 还 剩 下 不 少 的 指头 ， 必 须 继 续 发 明 新 的 符号 ， 这 
些 额外 的 符号 通常 用 英文 字母 表 开头 的 字母 表示 ， 因 此 以 16 为 底 (十 六 进 制 ， 或 缩写 为 
hex) 的 计数 是 这 样 的 : 

7 E 15 IE 23 
8 F 16 1D 24 
9 w W@W WE 25 
A 11 18 IF 26 
B 
G 


nN Un A U N“ OO 


D 14 1B 22 
当 十 六 进 制 数 字 包 含 许多 位 时 ,计数 就 有 点 儿 麻 烦 。 思 考 从 8BE7、C9D 和 9FFE 开始 
接 下 来 的 5 个 数字 : 
8BE7 C9D 9FFE 
8BE8 C9E 9FFF 


8BE9 C9F A000 
8BEA CAO A001 
8BEB CAI A002 


8BEC CA2 A003 

当 写 八进制 数 时 ， 数 字 看 上 去 有 比 它们 实际 要 大 的 趋势 ; 写成 十 六 进 制 数 时 ， 效 果 是 相 
反 的 ， 数 字 有 看 上 去 比 它们 实际 要 小 的 趋势 。 比 较 十 六 进 制 数 的 列表 和 十 进 制 数 的 列表 ， 可 
以 看 出 18 (hex) 实际 上 是 24 (dec). 


3.4.2 ”基数 转换 


在 十 六 进 制 中 ， 每 个 位 置 值 都 是 比 它 低 一 位 的 位 置 值 的 16 倍 。 十 六 进 制 转换 为 十 进 制 ， 
可 以 简单 地 把 位 置 值 乘 以 该 位 置 的 数字 ， 并 相 加 。 


图 3-22 给 出 了 把 8BE7 从 十 六 进 制 转换 到 十 进 制 的 过 程 。B 的 十 进 制 值 是 11, 


E 的 十 进 制 值 是 14. 


| ESE 1 的 位 置 
16 的 位 置 
256 的 位 置 


4096 的 位 置 
a) 8BE7 的 位 置 值 


1 = 
16= 
256 = 


7 


224 
2816 
4096 = 32 768 
35 815 
b) 将 8BE7 转 换 为 十 进 制 


图 3-22 将 十 六 进 制 数 转换 为 十 进 制 数 


从 十 进 制 转换 到 十 六 进 制 的 过 程 类 似 于 从 十 进 制 转 换 到 二 进 制 的 过 程 ， 不 过 不 是 一 个 接 
一 个 地 除 以 2， 而 是 除 以 16， 并 保存 余数 的 记录 ， 这 些 余 数 就 是 转换 后 的 十 六 进 制 数 。 
对 于 小 于 255 (dec) 或 FF (hex) 的 数 ， 两 种 进 制 互相 转换 用 图 3-23 所 示 的 表格 是 很 容 
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图 3-23 十 六 进 制 转换 表 


把 9C (hex) 转换 到 十 进 制 ， 查 看 9 行 和 C 列 找到 156 (dec); 把 125 (dec) 
转换 到 十 六 进 制 ， 在 表 的 主体 中 找到 125， 从 对 应 的 左 列 和 顶 行 得 出 7D (hex). 
如 果 计 算 机 以 二 进 制 格式 存储 信息 ,那么 为 什么 要 学 习 十 六 进 制 呢 ? 答案 是 ， 二 进 制 和 
十 六 进 制 之 间 存 在 特殊 关系 ， 如 图 3-24 所 示 。4 位 有 16 种 可 能 的 组 合 ， 而 正好 有 16 个 十 六 
进 制 数 字 ， 每 个 十 六 进 制 数 字 代 表 这 4 位 。 
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0100 1100 


0 4 8 C 

1 0001 5 0101 9 1001 D 1101 
2 0010 6 0110 A 1010 E 1110 
3 0011 7 0111 B 1011 F uu 


图 3-24 十 六 进 制 与 二 进 制 之 间 的 关系 
为 了 节约 打印 空间 ， 位 模式 经 常 被 写成 十 六 进 制 形式 。 一 个 16 位 机 器 的 手册 可 能 会 说 


某 个 内 存 位 置 包含 01D3， 这 要 比 说 它 包含 0000 0001 1101 0011 简短 多 了 。 


把 无 符号 二 进 制 转换 到 十 六 进 制 ， 从 最 右边 开始 把 位 划分 为 每 4 个 一 组 ， 给 每 组 一 个 
图 3-24 对 应 的 十 六 进 制 数 字 。 把 十 六 进 制 转换 到 无 符号 二 进 制 ， 只 需 简单 地 把 过 程 反 过 来 
即 可 。 
写 出 10 位 无 符号 二 进 制 数 10 1001 1100 的 十 六 进 制 形式 ， 从 最 右边 的 4 位 
1100 开始 : 
10 1001 1100 (bin) =29C (hex) 
由 于 10 位 不 能 刚好 分 为 4 个 一 组 ， 所 以 在 图 3-24 中 查找 最 左边 的 数字 时 ， 在 前 面 加 2 
个 0。 在 本 例 中 ， 最 左边 的 十 六 进 制 数字 来 自 
10 (bin) =0010 (bin) =2 (hex) m 
对 于 14 位 单元 
0D60 (hex) =00 1101 0110 0000 (bin) 
注意 ， 最 末尾 的 十 六 进 制 0 代表 4 个 二 进 制 0， 而 最 高 位 的 十 六 进 制 0 只 代表 2 个 二 进 
制 0。 m 
把 十 进 制 转换 为 无 符号 二 进 制 ， 你 可 能 想 要 用 十 六 进 制 - 十进制 表 作为 中 间 步 又 。 通 
过 查找 图 3-23 中 的 十 六 进 制 值 ， 不 用 任何 计算 ， 再 根据 图 3-24 把 每 个 数字 转换 为 二 进 制 
即 可 。 
对 于 6 位 单元 ， 
29 (dec) =1D (hex) =01 1101 (bin) 
转换 中 的 每 一 步 都 是 一 次 简单 的 查 表 。 a 
在 机 器 语言 程序 代码 或 程序 跟踪 记录 中 ， 几 乎 不 会 把 数字 写成 有 负 号 的 十 六 进 制 形式 ， 
而 是 把 符号 位 隐 含 地 包含 在 十 六 进 制 数字 表示 的 位 模式 中 。 你 必须 牢记 十 六 进 制 只 是 二 进 制 
序列 的 一 个 方便 的 缩写 ， 硬 件 只 存储 二 进 制 值 。 
如 果 一 个 10 位 的 内 存 位 置 包含 37A (hex)， 那 么 通过 思考 下 面 的 位 模式 可 以 
得 出 十 进 制 数 。 
37A (hex) =11 0111 1010 (bin) 
的 符号 位 是 1， 因 此 这 个 数 是 负数 ， 转 换 为 十 进 制 是 
37A (hex) =—134 (dec) 
注意 ， 尽 管 可 以 解释 成 一 个 负数 ， 但 是 十 六 进 制 数 不 会 写成 有 负 号 的 形式 。 E 


3.4.3 ASCII 字符 
因为 计算 机 内 存 是 二 进 制 的 ， 所 以 字母 字符 必须 要 编码 后 才能 存储 到 内 存 中 。 美 国信 息 
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交换 标准 代码 ( American Standard Code for Information Interchange, ASCII) 是 一 个 使 用 广 
泛 的 字母 字符 二 进 制 编码 。 

ASCI 包含 所 有 大 写 和 小 写 的 英文 字母 、10 个 数字 和 特殊 符号 (例如 ， 标 点 )。 它 的 一 
些 符 号 是 不 能 打印 的 ， 主 要 用 于 在 计算 机 之 间 传 递 信息 或 用 于 控制 外 围 设备 。 

ASCH 是 一 种 7 位 的 编码 。 因 为 7 位 有 2"=128 种 可 能 的 组 合 ， 所 以 有 128 个 ASCII 字 
符 ， 图 3-25 给 出 了 所 有 这 些 字符 。 表 中 第 一 列 是 不 可 打印 的 字符 ， 它 们 的 意思 列 在 表 下 ， 
表 中 其 余部 分 是 可 打印 的 字符 。 


ese eee + 


000 0000 空格 010 0000 










空 字符 

标题 开始 000 0001 01 ! 010 0001 21 A 1000001 4 a 110 0001 6l 
正文 开始 000 0010 02 " 010 0010 22 B 100 0010 42 b 110 0010 62 
正文 结束 000 0011 03 # 010 0011 23 c 100 0011 43 c 110 0011 63 
传输 结束 0000100 04 $ 0100100 24 D 1000100 44 a 1100100 64 
请 求 000 0101 05 a 010 0101 25 E 1000101 45 e 1100101 65 
收 到 通知 000 0110 06 & 010 0110 26 F 100 0110 46 f 110 0110 66 
响 铃 000 0111 07 * 010 DLT | 127 G 100 0111 47 g 110 0111 67 
退 格 000 1000 08 ( 010 1000 28 H 100 1000 48 h 110 1000 68 
水 平 制 表 符 0001001 09 ) 010 1001 29 I 1001001 49 i 110 1001 69 
换行 000 1010 0A * 010 1010 2A J 100 1010 4A j 110 1010 6A 
垂直 制 表 符 0001011 0B + 010 1011 2B K 100 1011 4B k 110 1011 6B 
换 页 000 1100 0C , 010 1100 2 L 100 1100 4C 1 110 1100 6C 
回 车 000 1101 0D - 010 101° 2D. Sm 100 1101 4D m 110 101 6D 
不 用 切换 000 1110 0E - 0101110 2E N 100 1110. 4E n 110 1110 6E 
启用 切换 000 1111 OF / 010 1111) 2F Oo 100 1111 4F o 110 1111 OF 
数据 链 路 转 义 001 0000 10 o O11 0000 30 P 101 0000 50 p 1il 0000 70 
设备 控制 1 0010001 11 1 O11 0001 31 Q 101 0001 51 q 111 0001 71 
设备 控制 2 ”001 0010 12 2 011 0010 32 R 101 0010 52 r 111 0010 72 
设备 控制 3 0010011 13 3 011 0011 33 s 101 0011 53 s 111 0011 73 
设备 控制 4 0010100 14 4 O11 0100 34 r 1010100 54 . +t 110100 74 
拒绝 接收 001 0101 15 5 011 0101 35 u 101 0101 i 55 u, 1114 102 pr 75 
同步 空闲 001 0110 16 6 011 0110 36 v 101010 56 v 111 0110 76 
传输 块 结束 001 0111 17 7 O OIL 2 27 w 101 oui 57 w 111 O11 77 
取消 001 1000 18 8 O11 1000 38 x 101 1000 58 x 1il 1000 78 
介质 中 断 001 1001 19 9 O11 1001 39 Y 101 1001 59 y 111 1001 79 
替补 001 1010 1A : O11 1010 3A z 101 1010 SA z 111 1010 7A 


图 3-25 美国 信息 交换 标准 代码 (ASCII) 
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ae 二 进 制 十 六 i pe EB FAR 二 进 制 十 六 进 制 
oe Ge an 78 ae oe 8 as an TP oe ae 
换 码 (溢出 ) 001 1011 1B ; 011 1011 3B [ 101 1011 5B { 111 1011 7B 
文件 分 隔 符 ” 001 1100 1C < O11 1100 3C \ 101 1100 5C | 11 1100 = =7C 
分 组 符 001 1101 1D = 0ll 101 3D ] 101 1101 SD } 1 1101 7D 
记录 分 离 符 0011110 1E > O11 1110 3E = OY 1110 SE ~ H 10 Æ 
单元 分 隔 符 ”001 1111 1F Pool OMT) ME BE oh OL Tinh” 1 删除 111 1111 7F 
控制 字符 的 缩写 
换 页 取消 
标题 开始 回 车 介质 中 断 
正文 开始 不 用 切换 Eth 
文 结束 时 用 切换 换 码 (溢出 ) 
mo 数据 链 路 转 义 文件 分 隔 符 
请 求 设备 控制 1 分 组 符 
收 到 通知 设备 控制 2 记录 分 离 符 
响 铃 设备 控制 3 单元 分 隔 符 
退 格 设备 控制 4 空格 
水 平 制 表 符 拒绝 接收 删除 
换行 同步 空闲 
垂直 制 表 符 传输 块 结束 
图 3-25 ( 续 ) 
二 进 制 序列 000 0111 代表 的 是 “ 响 铃 "， 它 使 终端 发 出 哗 哗 声 。ACK ( 收 到 通 


知 ) 和 NAK (拒绝 接收 ) 是 另外 两 个 不 可 打印 的 字符 ， 衬 它们 用 于 某 些 数据 传输 协议 。 如 果 发 
送 端 通过 通道 发 送 的 信息 包 被 检测 无 错误 ， 那么 接收 端 就 向 发 送 端 回 送 ACK， 然 后 发 送 端 
继续 发 下 一 个 包 。 如 果 接 收 端 检测 出 错误 ， 它 就 向 发 送 端 回 送 NAK， 然 后 发 送 端 重新 发 送 
在 初始 传输 中 损坏 的 包 。 a 
名 字 Tom 会 以 下 列 ASCII 形式 存储 ， 
101 0100 
1101111 
110 1101 
如 果 将 这 个 位 序列 发 送 到 输出 终端 ， 就 会 显示 “Tom ”。 5 
街道 地 址 52 Elm 会 以 下 列 ASCH 形式 存储 ， 


011 0101 
011 0010 
010 0000 
100 0101 
110 1100 
110 1101 


2 和 之 间 的 空格 是 一 个 独立 的 ASCII 字 符 。 = 








3.4.4 Unicode 字符 


第 一 批 电 子 计 算 机 是 用 数字 进行 数学 计算 的 。 最 终 ， 它 们 也 处 理 文本 数据 ， 而 ASCII 
码 则 成 为 处 理 拉 丁字 母 文本 的 普遍 标准 。 随 着 全 球 普 及 计算 机 技术 ， 使 用 各 种 语言 字母 处 理 
文本 产生 了 许多 不 兼容 的 系统 。Unicode 联盟 的 建立 是 为 了 收集 和 编目 世界 上 所 有 的 口语 的 
全 部 字母 ， 包括 当代 和 古代 的 所 有 语言 。 这 是 建立 标准 系统 的 第 一 步 ， 这 个 标准 用 于 在 志 界 
范围 内 的 交换 、 处 理 和 显示 这 些 自然 语言 文本 。 

严格 来 说 ， 标 准将 字符 组 织 成 字母 表 ， 而 不 是 语言 。 一 个 字母 表 可 以 用 于 多 种 语言 。 
比如 ， 扩 展 的 拉丁 语 字 母 表 可 以 用 于 许多 欧洲 和 美洲 语言 。Unicode 标准 7.0 版 包含 123 个 
自然 语言 字母 表 、15 个 其 他 符号 字母 表 。 自 然 语言 字母 表 的 例子 有 巴厘 岛 语 、 切 诺 基 语 、 
埃及 象形 文字 、 希 脂 语 、 腓 尼 基 语 和 泰语 。 其 他 符号 字母 表 的 例子 有 盲文 图 案 、 表 情 符号 、 
数学 符号 和 音乐 符号 。 

所 有 字母 表 中 的 每 一 个 字符 都 有 一 个 唯一 的 标识 号 ， 一般 用 十 六 进 制 书写 ， 称 为 码 位 
(code point). 十 六 进 制 数字 前 面 加 上 “U +” 表示 它 是 一 个 Unicode 码 位 。 对 应 于 码 位 的 是 
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一 个 字形 ( glyph)， 它 是 符号 在 页 面 或 屏幕 上 的 图 形 表示 。 比如 ， 在 希 伯 来 语 字 和 母 表 中 ， 码 
点 U+05D1 具有 字形 3。 

图 3-26 给 出 了 Unicode 标准 中 一 些 码 位 和 字形 的 示例 。CJK 统一 字母 表 是 针对 中 国 、 
日 本 和 韩国 的 书面 语言 的 ， 这 些 语 言 使 用 共同 的 字符 集 ， 但 又 存在 一 些 变化 。 这 些 亚洲 文字 
系统 中 有 数 万 个 字符 ， 都 是 基于 一 组 通用 的 汉字 。 为 了 将 不 必要 的 重复 减 到 最 少 ，Unicode 
联盟 把 这 些 符号 合并 成 一 个 统一 的 字符 集 。 汉 字 字 符 集 的 统一 正在 由 来 自 中 国 、 朝 鲜 、 韩 
国 、 日 本 、 越 南 以 及 其 他 国家 的 一 组 专家 持续 推进 中 。 





Arabic U+063_ 3 3 J mw o e œ bh 
Armeniaa, UHA 2 9 NU 8 GO 
Braille Patterns U+287_ , 2 8 g g ™ 
CK Unified = UMEB. N He SRR HH 
Cyrillic U+41 A 5 BT A E X 3 
Beypian Hierogyphs U0 $ d S aAA 
Emoticons UHF © 0000000 
R LA, R A ae 
Basic Latin (ASCI) U+004. @ A B C DEF G 
Latin-1 Supplement U+00E, & 4 4 4 a Eae s 


3-26 Unicode 字符 集中 的 一 些 码 位 和 字形 


码 位 向 后 兼容 ASCII 码 。 比 如 ， 在 图 3-25 的 ASCII 表 中 ， 拉 丁字 母 S 用 7 位 存储 为 
101 0011 (bin)， 即 53 (hex). BA, 在 Unicode 编码 中 S 的 码 位 就 是 U+0053 。 该 标准 要 求 
U+ 的 后 面 至 少 要 有 4 个 十 六 进 制 位 ， 如 果 需 要 的 话 要 在 数字 前 面 补 0。 

一 个 码 位 可 以 有 多 个 字形 。 比 如 ， 根 据 其 在 单词 中 的 位 置 ， 一 个 阿拉 伯 字 母 可 以 呈 
现 出 不 同 的 字形 。 而 另 一 方面 ， 一 个 字形 可 以 被 用 来 表示 两 个 码 位 。 拉 丁 码 位 U+0066 和 
U+0069 分 别 表示 ff 和 i， 它 们 连 起 来 表示 的 是 连 字 字形 fio 

Unicode 码 空间 的 范围 是 0 ~ 10 FFFF(hex)， 或 者 0 一 100001111 1111 1111 1111(bin), 
又 或 者 0 一 1114 111 (dec)。 在 这 些 上 百 万 的 码 位 中 ,已 经 分 配 了 约 四 分 之 一 。 有 些 值 预 留 
为 专用 ， 每 个 Unicode 标准 修订 都 为 码 位 分 配 了 更 多 的 值 。 理 论 上 ， 可 以 用 一 个 21 位 的 数 
字 来 表示 每 个 码 位 。 由 于 计算 机 内 存 通常 是 按 8 位 的 字 节 进行 组 织 ， 所 以 可 以 用 3 个 字 节 来 
存储 每 个 码 位 ， 其 中 前 三 位 没有 使 用 。 

然而 ， 大 多 数 计 算 机 以 32 位 (4 字 节 ) 或 64 位 (8 字 节 ) 的 块 作为 信息 处 理 单位 。 因 
此 ， 处 理 文 本 信息 最 有 效 的 方法 是 将 每 个 码 位 存储 在 32 位 单元 中 ， 即 使 前 11 位 不 被 使 
用 ,并 且 始 终 设 置 为 零 。 这 种 编码 方法 称 为 UTF-32， 其 中 UTF 代表 Unicode 转换 格式 
(Unicode Transformation Format)。UTF-32 总 是 需要 八 个 十 六 进 制 字符 来 表示 其 四 个 字 节 。 

要 确定 字母 z 在 UTF-32 中 是 如 何 存储 的 ， 首 先 在 ASCII 码 表 中 查 出 其 值 为 
7A (hex)。 由 于 Unicode 编码 向 后 兼容 ASCII 码 ， 因 此 字母 z 的 码 位 就 是 U+007A。 则 包含 
前 缀 零 的 32 位 二 进 制 UTF-32 编码 形式 如 下 : 

0000 0000 0000 0000 0000 0000 0111 1010 

由 此 可 知 ，U+007A 的 编码 为 0000 007A (UTF-32 ) 。 m 


表情 符号 @ 的 码 位 为 U+1F617， 要 确定 其 UTF-32 编码 只 需 加 上 数量 正确 的 
前 级 零 。 其 编码 为 0001 F617 (UTF-32 ) 。 m 

虽然 UTF-32 在 处 理 文 本 信息 方面 很 有 效率 ， 但 在 存储 和 传输 文本 信息 方面 却 效 果 不 
佳 。 如 果 一 个 文件 主要 存储 ASCI 码 字符 ， 那 么 四 分 之 三 的 文件 空间 将 会 是 零 。UTF-8 是 一 
种 流行 的 编码 标准 ， 可 以 表示 全 部 的 Unicode 字符 。 它 用 一 到 四 个 字 节 来 存储 一 个 字符 ， 所 
以 UTF-8 占用 的 空间 比 UTF-32 要 小 。 基 本 多 语言 平面 (basic multilingual plane) 有 64k; 个 
码 位 ， 范 围 从 U+0000 到 U+FFFF， 它 几乎 包含 了 所 有 现代 语言 的 字符 。UTF-8 可 以 用 一 到 
三 个 字 节 表示 这 些 码 位 ， 且 只 用 一 个 字 节 表示 一 个 ASCII 码 字符 。 

图 3-27 给 出 了 UTF-8 的 编码 模式 。 第 一 列 标识 为 “位 数 "， 表 示 码 位 中 位 数 的 上 限 ， 不 
包括 任何 前 导 零 。 编 码 中 的 x 代表 码 位 最 右边 的 位 ， 它 们 分 布 在 一 到 四 个 字 节 中 。 






U+0 XXXX: 





11 U+0080 U+07FF 110xxxxx 10xxxxxx 
16 U+0800 U+FFFF 1110xxxx 10xxxxxx 10xxxxxx 
21 U+10000 U+1FFFFF 11110xxx 10xxxxxx 1OXXXxxx | 10xxxxxx 


图 3-27 UTF-8 编码 模式 


表 中 第 一 行 对 应 的 是 ASCII 字符 ， 其 位 数 上 限 为 7 位 。 一 个 ASCII 字符 存储 在 一 个 
字 节 中 ， 字 节 第 一 个 位 是 0， 后 面 的 7 位 与 ASCII 码 的 7 位 是 相同 的 。 解 码 UTF-8 字符 串 
的 第 一 步 是 检查 第 一 个 字 节 的 第 一 个 位 ， 如 果 为 零 ， 则 第 一 个 字符 是 ASCIT 字符 ， 可 以 从 
ASCH 表 中 确定 ,后 一 个 字 节 是 下 一 个 字符 的 第 一 个 字 节 。 

如 果 第 一 个 字 节 的 第 一 位 是 1， 则 第 一 个 字符 不 在 U+0000 到 U+007F 范围 内 ， 就 不 是 
ASCI 字 符 ， 那 么 它 需 要 多 占 一 个 字 节 。 在 这 种 情况 下 ， 第 一 个 字 节 中 的 前 导 1 的 数量 等 于 
该 字符 占用 的 总 字 节 数 。 码 位 的 一 些 位 被 存储 在 第 一 个 字 节 中 ， 还 有 一 些 存储 在 剩余 的 连续 
字 节 中 。 每 个 连续 字 节 以 字符 串 10 开始 ， 并 存储 码 位 中 的 六 个 位 。 

表情 符号 @ 的 码 位 为 U+1F617， 要 确定 其 UTF-8 编码 首先 确定 码 位 的 位 数 上 
限 。 由 图 3-27 可 知 ， 该 码 位 在 U+10000 到 U+1FFFF 之 间 ， 因 此 码 位 最 右边 的 21 位 需要 占 
据 4 个 字 节 。1F617 (hex) 的 最 右 21 位 为 

0 0001 1111 0110 0001 0111 
添加 足够 多 的 前 导 0 达到 21 位。 图 3-27 的 最 后 一 行 表示 字 节 1 存储 了 前 三 位 ， 字 节 2 存储 
随后 的 6 位 ， 字 节 3 存储 再 随后 的 6 位 ， 字 节 4 存储 最 后 6 位 。 据 此 重新 划分 上 面 的 21 位 ， 
得 到 

000 011111 011000 010111 

由 表 可 得 ， 字 节 1 的 格式 为 11110xxx， 将 前 3 ARIA x 的 位 置 得 到 11110000， 同 理 
可 得 字 节 3 和 字 节 4。 那 么 四 字 节 的 结果 位 模式 为 

11110000 10011111 10011000 10010111 

因此 ，U+1F617 编码 得 到 F09F 9897 (UTF-8 ), ix 5 fi] 3.34 中 UTF-32 的 四 字 节 编码 是 
不 同 的 。 = 

要 确定 UTF-8 字 节 序列 70 C3 A6 OF 6E 的 码 位 序列 ， 首 先 把 字 节 序列 表示 为 
二 进 制 
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01110000 11000011 10100110 01101111 01101110 

由 于 前 导 位 是 0， 因 此 可 以 立即 判断 出 第 一 个 、 第 四 个 和 第 五 个 字 节 是 ASCII 字符 。 查 
阅 ASCH 码 表 ， 可 得 这 些 字 节 对 应 的 字母 分 别 是 p、o 和 n。 第 二 个 字 节 的 前 三 位 110 表示 
有 11 位 分 布 在 两 个 (一 对 ) 字 节 中 ， 如 图 3-27 表格 表 体 中 第 二 行 所 示 。 第 三 个 字 节 的 前 两 
位 10 与 第 二 个 字 节 是 一 致 的 ， 这 个 10 表示 该 字 节 是 一 个 延续 字 节 。 抽 取 第 二 个 字 节 (一 对 
字 节 中 的 第 一 个 字 节 ) 最 右边 的 5 位 和 第 三 个 字 节 (一 对 字 节 中 的 第 二 个 字 节 ) 最 右边 的 6 
位 ,得 到 11 位 : 

00011 100110 
加 上 前 导 零 并 重新 分 组 后 得 到 : 

0000 0000 1110 0110 
即 码 位 U+00E6， 其 对 应 的 Unicode 字符 为 。 由 此 ， 初 始 给 出 的 5 字 节 序列 就 是 码 位 序列 


U+0070、U+00E6、U+006F 和 U+006E 的 UTF-8 编码 ， 其 代表 的 字符 串 是 “paon”。 m 
图 3-27 显示 UTF-8 并 不 允许 所 有 的 位 模式 。 比 如 ， 下 列 位 模式 在 UTF-8 编码 文件 中 就 
是 非法 的 。 


11100011 01000001 

因为 第 一 字 节 的 前 四 位 1110 表示 该 字 节 是 连续 三 个 字 节 中 的 第 一 个 ， 但 第 二 个 字 节 的 
前 导 零 又 表示 这 个 字 节 是 一 个 ASCI 字符 ， 不 是 一 个 延续 字 节 。 如 果 在 UTF-8 编码 的 文件 
中 检测 到 这 种 模式 ， 那 么 数据 已 损坏 。 

UTF-8 的 主要 优点 是 其 自 同步 特性 。 解 码 器 可 以 通过 检查 前 缀 位 来 唯一 地 识别 序列 中 的 
任何 字 节 类 型 。 比 如 ， 如 果 前 两 位 是 10， 就 表示 这 是 个 延续 字 节 。 如 果 前 四 位 是 1110， 就 
表示 这 是 三 字 节 序列 中 的 第 一 个 字 节 。 这 种 自 同步 特性 使 得 UTF-8 解码 器 可 以 在 数据 发 生 
损坏 时 恢复 大 部 分 文本 。 

UTF-8 是 万 维 网 上 最 常见 的 编码 标准 ， 也 已 经 成 为 多 语言 应 用 程序 的 默认 标准 。 操 作 
系统 正在 整合 UTF-8， 以 便 文件 和 文件 可 以 用 户 的 母语 命名 。 现 代 编 程 语言 (如 Python 和 
Swift) 都 内 置 了 UTF-8， 这 样 程序 员 就 可 以 将 变量 命名 为 paon， 或 者 甚至 于 是 晶 昌 。 文 本 
编辑 器 传统 上 只 能 处 理 纯 ASCII 文 本， 与 之 相反 的 是 文字 处 理 器 ， 它 总 是 格式 友好 的 ， 处 
HE UTF-8 编码 文本 文件 的 能 力也 越 来 越 强 。 


3.5 浮 点 数 表 示 


本 章 前 面 几 节 描述 的 数值 表示 是 对 于 整数 值 的 。C 语言 有 3 种 数值 类 型 有 小 数 部 分 : 

e float 单 精度 浮 点 数 

e double RAR LIF 

e long double 扩展 双 精 度 浮 点 数 

这 些 类 型 的 值 在 ISA3 层 不 能 以 补 码 二 进 制 表示 存储 ， 因 为 存储 必须 提供 存放 数字 中 小 
数 点 位 置 的 方式 。 浮 点 数值 用 科学 记 数 法 的 二 进 制 版 本 来 存储 。 


3.5.1 二 进 制 小 数 


二 进 制 小 数 有 一 个 二 进 制 小 数 点 ， 它 是 十 进 制 小 数 点 的 二 进 制版 本 。 
GEED 图 3-28a 展示 了 101.011 (bin) 的 位 置 值 。 二 进 制 小 数 点 左边 的 位 与 图 3-2 无 
符号 二 进 制 表示 中 相应 的 位 有 相同 的 位 置 值 。 二 进 制 小 数 点 右边 的 位 置 值 从 1/2 开始 ， 每 个 
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位 置 值 是 前 一 位 的 一 半 。 图 3-28b 给 出 的 加 法 表明 得 到 的 值 是 5.375 (dec). m 
Lore vi 

—- 1 内 的 位 置 =0.125 
/的 位 置 1 V, 的 位 置 = 0.25 
y 的 位 0 1 AJE = 0.0 
ime 1 1 的 位 置 =1.0 
1 的 位 置 0 2 的 位 置 =0.0 
2 的 位 置 1 4 的 位 置 =4.0 
4 的 位 置 5.375 (dec) 

a) 101.011 (bin) 的 位 置 值 b) 把 101.011 (bin) 转换 为 十 进 制 


图 3-28 ”把 二 进 制 小 数 转换 为 十 进 制 


图 3-29 是 有 小 数 部 分 数字 的 多 项 式 表 
示 。 小 数 点 左边 一 位 的 位 置 值 总 是 基数 的 0 ee 
次 方 ， 即 1。 往 左下 一 个 有 效 位 是 基数 的 1 ye ee 
次 方 ， 即 基数 本 身 。 小 数 点 右边 一 位 的 位 5x 10?+0x10'+6x10°+7x 107 +2x10?+1 x 10° 
置 值 是 基数 的 -1 次 方 ， 往 右 下 一 个 有 效 位 b) 十 进 制 数 506.721 
是 基数 的 =2 次 方 ， 右 边 每 个 位 置 值 是 它 左 3-29 浮 点 数 的 多 项 式 表 示 
边 位 位 置 值 的 1/ 基数 倍 。 

确定 二 进 制 小 数 的 十 进 制 值 分 为 两 步 。 
首先 ， 用 例 3.3 中 无 符号 二 进 制 数 转换 的 方法 转换 二 进 制 小 数 点 左边 的 位 。 然 后 ， 用 逐 位 翻 
浊 的 算法 转换 二 进 制 小 数 点 右边 的 位 。 

图 3-30 展示 了 把 6.585 937 5 
( dec) 转化 为 二 进 制 的 过 程 。 转 换 整 数 部 分 
即 在 小 数 点 左边 得 到 110 (bin); 转换 小 数 





6.5859375 


部 分 是 把 小 数 点 右边 的 数字 写 在 表格 右 列 6 (dee) = 110 (bin) 
的 头 部 ， 小 数 部 分 乘 以 小 数 点 左边 的 数 a) 转换 整数 部 分 
字 写 在 左 列 ， 小 数 部 分 写 在 右 列 。 下 次 乘 5859375 


171875 
34375 
6875 
375 

75 

-5 


2 时 ,不 包括 整数 部 分 。 例 如 ,把 .171 875 
HE 2 得 到 0.343 75， 而 不 是 把 1.171 875 Æ 
2。 左 列 从 上 到 下 的 数字 就 是 二 进 制 小 数 部 
分 从 左 到 右 的 位 ， 因 此 6.585 937 5 (dec) 
=110.100 101 1 (bin). « 

把 小 数 部 分 从 十 进 制 转换 到 二 进 制 的 
算法 就 像 是 把 整数 部 分 从 十 进 制 转换 到 二 
进 制 算法 的 镜像 。 图 3-5 给 出 了 用 逐 位 除 
以 2 的 算法 转换 十 进 制 整数 的 过 程 。 除 法 的 余数 就 是 得 到 的 数字 位 ， 顺序 是 从 二 进 制 小 数 点 
开始 从 右 往 左 。 用 逐 位 乘 以 2 的 算法 转换 小 数 部 分 ， 乘 法 得 到 的 整数 部 分 是 生成 的 数字 位 ， 
顺序 是 从 二 进 制 小 数 点 开始 从 左 往 右 。 

一 个 可 以 用 有 限 位 十 进 制 表 示 的 数 ， 它 的 二 进 制 数 表 示 可 能 是 无 限 位 的 。 


1 
0 
0 
1 
0 
1 
i 
b 


.0 
) 转换 小 数 部 分 
图 3-30 ”十进制 转换 为 二 进 制 
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图 3-31 展示 的 是 把 0.2 (dec) 转换 为 二 进 制 的 过 程 。 第 一 次 乘 2 得 到 0.4， 反 
复 几 次 后 又 得 到 了 0.4。 显 然 这 个 过 程 不 会 终止 ， 所 以 0.2 (dec) =0.001100110011... (bin), 
位 模式 0011 会 不 断 重 复 。 a 

由 于 所 有 计算 机 单元 都 只 能 存储 有 限 的 位 ， 所 以 0.2 
(dec) 不 能 被 精确 存储 ， 必 定 是 一 个 近似 值 。 我 们 应 该 意识 
到 由 于 二 进 制 表 示 值 的 固有 伟人 误差 ， 所 以 如 果 用 像 C 这 
样 的 HOL6 层 语 言 做 加 法 0.2 + 0.2， 也 许 不 会 精确 得 到 0.4。 
正 是 由 于 这 个 原因 ， 好 的 数值 软件 几乎 不 会 检测 两 个 浮 点 数 
是 否 完 全 相等 ， 而 是 用 软件 维护 了 一 个 很 小 的 非 零 容忍 值 ， 
用 以 表示 如 果 两 个 浮 点 数 的 差 小 于 该 值 就 被 看 作 相 等 。 如 果 
容忍 值 是 0.0001, 那么 1.382 64 和 1.382 67 会 被 认为 是 相等 8331 一 个 具有 无 休止 的 二 
的 ， 因 为 它们 的 差 0.000 03 小 于 容忍 值 0.0001。 进 制 表达 的 十 进 制 数 


3.5.2” 余 码 表 示 

可 以 用 常见 于 十 进 制 数 的 科学 记 数 法 的 二 进 制版 本 来 表示 浮 点 数 。 一 个 以 科学 记 数 法 表 
示 的 非 零 数 是 规格 化 的 ， 如 果 它 的 第 一 个 非 零 位 正好 在 小 数 点 左边 。 因 为 数字 0 没有 第 一 个 
非 零 位 ， 因 此 0 不 能 被 规格 化 。 

十 进 制 数 -328.4 的 科学 记 数 法 规格 化 表示 是 -3.284x 10°, 10 的 2 次 方 的 
作用 是 把 小 数 点 往 右 移动 2 位。 类似 地 ， 二 进 制 数 =10101.101 的 科学 记 数 法 规格 化 形式 





是 -1.0101101x2 ，2 的 4 次 方 的 作用 是 把 二 进 制 小 数 点 往 右 移动 4 位 。 al 
二 进 制 数 0.00101101 的 科学 记 数 法 规格 化 表示 是 1.01101 x 2°, 2 的 -3 次 方 
的 作用 是 把 二 进 制 小 数 点 往 左 移动 3 位 。 f} 


一 般 来 说 ， 浮 点 数 可 以 是 正 数 或 负数 ， 它 的 指数 也 可 以 是 正 整数 或 负 整数 。 图 3-32 展 
示 了 存储 浮 点 数值 的 一 个 内 存单 元 。 单 元 分 为 3 个 字段 ,第 
一 个 字段 1 位 ， 用 于 存储 该 数 的 符号 ， 第 二 个 字段 存储 的 位 


代表 的 是 规格 化 二 进 制 数 的 阶 码 (指数 )， 第 三 个 字段 称 为 尾 a 

a (有 效 数字 )， 存 储 代表 数值 大 小 的 位 。 | = 
阶 码 中 存储 的 位 越 多 ， 浮 点 数值 的 范围 越 大 。 尾 数 中 存 阶 码 

储 的 位 数 越 多 ， 数 值 表示 的 精度 越 高 。 常 用 表示 形式 是 阶 码 符号 

8 位 ， 位 数 23 位 。 为 了 展示 浮 点 数 格式 的 概念 ， 本 节 的 例子 图 3-32 浮 点 数 的 存储 


中 阶 码 是 3 位 ， 位 数 是 4 位。 这 些 位 数 少 得 不 切实 际 ， 但 是 
却 有 助 于 在 不 用 大 量 位 数 的 情况 下 进行 格式 说 明 。 

任何 有 符号 整数 的 表示 方法 都 可 以 用 于 存储 阶 码 。 你 可 能 会 想到 用 补 码 表示 ， 因 为 大 多 
数 计算 机 存储 有 符号 整数 都 用 它 。 但 是 实际 上 没有 用 补 码 ， 而 是 用 了 有 偏差 的 表示 方法 ， 后 
面 很 快 会 解释 这 个 原因 。 

一 个 5 位 单元 有 偏差 表示 的 例子 是 余 15 FS (Excess 15 ) 。 单 元 存储 数字 的 范围 十 进 制 表 
示 为 -15 到 16， 二 进 制 表 示 为 00000 到 11111。 把 十 进 制 转换 到 余 15 码 是 把 十 进 制 数值 加 
15， 然 后 按照 无 符号 数 方式 转换 为 二 进 制 。 从 余 15 码 转换 为 十 进 制 是 把 它 按 照 无 符号 数 写 
作 十 进 制 数 ， 然 后 减 去 15。 在 余 15 码 中 ， 第 一 位 表示 一 个 值 是 正 还 是 负 ， 不 过 与 补 码 表示 
不 一 样 ，1 表示 正 值 ，0 表示 负 值 。 
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存储 单元 为 5 位 ， 把 十 进 制 5 转换 到 余 15 码 ，5+15=20。 然 后 按照 无 符号 数 
方法 把 20 转换 为 二 进 制 ，20 (dec) =10100 (bin)， 因 此 5 (dec) =10100 ( 余 15 )。 第 一 位 是 


1 表示 是 一 个 正 值 。 a 
把 00011 MA 15 码 转换 到 十 进 制 ， 把 00011 当 作 无 符号 值 转换 ,00011 (bin) = 
3 (dec)， 然 后 3-15=-12， 因 此 00011 (48 15 #3) =-12 (dec), m 


图 3-33 展示 了 一 个 3 位 单元 以 余 3 码 表 示 和 以 补 码 表示 存储 整数 的 比较 。 每 种 表示 法 
存储 8 个 值 ， 余 3 码 的 表 数 范围 是 -3 到 4 
(dec)， 而 补 码 的 是 -4 到 3 (dec), 


3.5.3 ”隐藏 位 


在 图 3-32 中 ， 保 留 一 位 来 表示 数 的 符 = = i 
号 , 但 是 没有 位 表示 小 数 点 。 用 一 位 来 表 | | co | 
示 小 数 点 是 没有 必要 的 ， 因 为 数 以 规格 化 A ve 
的 形式 存储 ， 系 统 可 以 假设 第 一 个 1 就 在 


0 
1 100 oL 
小 数 点 的 左边 。 此外， 由 于 小 数 点 的 左边 2 101 010 
3 
4 





总 是 有 个 1， 所 以 也 完全 不 需要 存储 前 导 110 OL 
1。 要 存储 十 进 制 数值 ， 首 先 将 其 转换 为 二 111 

进 制 ， 写 成 规格 化 科学 记 数 法 的 形式 ， 用 
余 码 表示 存储 阶 码 ， 去 掉 前 导 1， 再 把 余 
下 的 有 效 位 数 存储 到 尾数 字段 。 假 设 出 现 
在 小 数 点 左 侧 ， 但 又 没有 显 式 存储 的 那 一 个 位 被 称 为 隐藏 位 (hidden bit), 

假设 3 位 阶 码 采用 余 3 码 表 示 ， 尾 数 用 4 位 表示 ， 问 如 何 存储 3.375 ? 转换 整 
数 部 分 得 到 3 (dec) =11 (bin )。 转 换 小 数 部 分 得 到 0.375 (dec) =0.011 (bin)。 完 整 的 二 进 
制 数 为 3.375 (dec) =11.011 (bin)， 规 格 化 二 进 制 科 学 记 数 法 形式 为 1.1011 x 2'。 该 数 为 正 ， 
因此 符号 位 是 0。 由 图 3-33 可 知 阶 码 为 1 (dec) =100 ( 余 3 )。 去 掉 前 导 1， 小 数 点 右边 四 位 
是 1011。 所 以 ，3.375 被 存储 为 0100 1011. m 

当然 隐藏 位 是 假定 的 ， 而 不 是 被 忽略 的 。 当 从 内 存 读 取 二 进 制 浮 点 数值 时 ， 编 译 器 假定 
没有 存储 隐藏 位 。 它 会 生成 代码 插入 隐藏 位 ， 然 后 再 用 数量 完整 的 位 来 执行 各 种 计算 。 浮 点 
数 硬 件 为 了 精度 甚至 会 增加 一 些 位 ， 这 些 位 被 称 为 保护 位 ( guard digit)， 它 们 存在 于 整个 计 
算 过 程 。 计 算 完 成 后 ， 系 统 会 丢弃 这 些 保护 位 和 假设 的 隐藏 位 ， 尽 可 能 多 地 存储 二 进 制 小 数 
点 右边 的 位 作为 尾数 。 

不 存储 前 导 1 可 以 得 到 更 高 的 精度 。 在 上 面 的 例子 中 ， 数 值 是 1.1011。 使 用 隐藏 位 ， 去 
掉 前 导 1， 将 .1011 存储 到 4 位 的 尾数 字段 。 在 不 使 用 隐藏 位 的 表示 中 ， 在 4 位 尾数 字段 中 
存储 的 是 最 高 有 效 位 1,011， 而 强制 丢弃 最 低 有 效 值 0.0001。 其 结果 数值 只 能 是 近似 于 十 进 
制 值 3.375。 

由 于 任何 内 存单 元 都 有 有 限 个 位 ， 即 使 用 了 隐藏 位 ， 近 似 也 是 不 可 避免 的 。 系 统 按照 
“就 近 舍 人 ， 对 半 取 偶 ” 的 原则 ， 售 人 其 要 丢弃 的 最 低 有 效 位 而 达到 近似 。 图 3-34 展示 了 该 
原则 在 十 进 制 数 和 二 进 制 数 上 的 使 用 。23.499 被 伟人 为 23， 因 为 该 数 距 离 23 比 距 离 24 更 
近 。 同样 ,23.501 距离 24 比 距 离 23 更 近 。 但 是 ,23.5 距离 23 和 24 一 样 近 ， 这 就 是 “对 半 ”。 
它 被 舍 入 为 24， 因 为 24 是 偶数 。 同 样 ， 二 进 制 数 1011.1 与 1011 和 1100 的 距离 相同 ， 这 也 


图 3-33 3 位 单元 存储 的 有 符号 整数 
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E “OPE”. CREAH 1100, AW 1100 是 偶数 。 


ERS i, RRA 





23.499 23 1011.011 1011 
23.5 24 1011.1 1100 
23.501 24 1011.101 1100 
24.499 24 1100.011 1100 
24.5 24 1100.1 1100 
24.501 25 1100.101 1101 


图 3-34 ”就近 舍 人 ， 对 半 取 偶 


假设 3 位 阶 码 采用 余 3 码 表 示 ， 尾 数 用 4 位 表示 ， 问 如 何 存储 -13.75 ? 转换 
整数 部 分 得 到 13 (dec) =1101 ( bin)。 转 换 小 数 部 分 得 到 0.75 (dec) =0.11 ( bin)。 完 整 的 
二 进 制 数 为 13.75 (dec) =1101.11 (bin)， 规 格 化 二 进 制 科学 记 数 法 形式 为 1.10111 x2 。 该 
数 为 负 ， 因 此 符号 位 是 1。 阶 码 为 3 (dec) =110 ( 余 3 )。 去 掉 前 导 1， 小 数 点 右边 五 位 是 
10111。 但 是 尾数 部 分 只 能 存储 四 位 ， 而 .10111 与 .1011 和 .1100 的 距离 是 一 样 的 ， 因 此 对 
半 原 则 有 效 。 由 于 1011 是 奇数 ，1100 是 偶数 ， 所 以 伟人 结果 为 .1100。 由 此 ，-13.75 被 存 
储 为 1110 1100。 m 


3.5.4 “特殊 值 


有 些 实际 值 需要 特殊 看 待 ， 最 明显 的 是 0， 因为 它 的 二 进 制 表 示 中 没有 为 1 的 位 ， 因 此 
它 不 能 规格 化 表示 ， 必 须 为 它 设 置 一 个 特殊 的 位 模式 。 标 准 的 做 法 是 把 阶 码 全 置 为 0， 尾 数 
也 全 置 为 0。 那 么 符号 位 呢 ? 最 常见 的 是 0 有 两 种 表示 : 一 个 正 0， 一 个 负 0。 如 果 阶 码 3 
位 ， 尾 数 4 位 ， 两 种 0 的 位 模式 是 

1 000 0000 (bin) =-0.0 (dec) 
0 000 0000 (bin) =+0.0 (dec) 

不 过 ，0 的 存储 还 有 其 他 解决 方案 。 如 果 +0.0 的 位 模式 没有 特殊 指定 ， 那么 0 000 0000 
会 被 解读 成 有 隐藏 位 ， 看 作 1.0000 x 2° (bin) =0.125， 如 果 这 个 值 没 有 被 保留 为 0， 那 么 这 
就 是 可 以 存储 的 最 小 正 值 。 如 果 这 个 位 模式 为 0 保留 ， 那么 可 存储 的 最 小 正 值 是 略 大 的 

0 000 0001=1.0001 x 2° (bin) =0.132 812 5 
除了 符号 位 是 1， 数值 最 小 负数 的 尾数 应 该 是 一 样 。 可 以 存储 的 最 大 正 整 数 的 位 模式 应 该 具 
有 最 大 阶 码 和 最 大 尾数 。 具 有 最 大 数值 大 小 的 位 模式 是 
0111 1111 (bin) =+31.0 (dec) 

图 3-35 是 0 有 唯一 特殊 值 的 表示 方式 所 对 应 的 数 轴 。 和 整数 表示 一 样 ， 可 以 存储 多 大 
的 值 是 有 限制 的 。 如 果 9.5 乘 以 12.0， 这 两 者 都 在 范围 内 ， 但 是 乘积 的 真实 值 114.0 在 正 上 

然而 ， 和 整数 值 不 一 样 的 是 ， 实 数 轴 有 下 洲 区 。 如 果 0.145 乘 以 0.145， 两 者 都 在 范围 
内 ， 但 乘积 的 真 值 0.021 025 却 在 正 下 洲 区 ， 可 以 存储 的 最 小 正 值 是 0.132 815。 

当 计 算 以 确切 的 精度 进行 时 ， 近 似 的 浮 点 数 的 数值 计算 结果 要 和 预期 保持 一 致 。 例 如 ， 


PIF EMT 105 


假设 9.5 FEV 12.0， 结 果 应 该 存储 什么 呢 ? 假设 把 最 大 值 31.0 作为 近似 结果 存储 。 再 假设 该 
结果 是 一 个 更 长 计算 的 中 间 值 ， 然 后 要 计算 它 的 一 半 是 多 少 ， 将 得 到 15.5， 这 和 正确 的 值 相 
差 甚 远 。 


—31.0 —0.1328125 0.0 0.1328125 31.0 
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图 3-35 0 有 唯一 特殊 值 的 实数 轴 


在 下 洲 区 有 同样 的 问题 。 如 果 把 0.0 作为 0. 021 025 的 近似 值 存 储 ， 然 后 再 把 它 乘 以 
12.0， 就 会 得 到 0.0。 这 里 存在 被 看 上 去 合理 的 值 误 导 的 风险 。 

由 上 洲 和 下 溢 引 起 的 这 些 问 题 ， 通 过 引入 更 多 位 模式 的 特殊 值 会 有 所 改善 。 与 0 的 表 
示 一 样 ， 必 须 用 一 些 特殊 的 位 模式 来 表示 这 些 特殊 值 ， 如 果 这 些 位 模式 不 用 来 表示 特殊 值 ， 
就 可 以 用 来 表示 数 轴 上 的 值 。 除 了 0 以 
外 ， 有 3 个 常用 的 特殊 值 : 无 穷 大 、 非 
数 (NaN) 和 非 规格 化 数 。 图 3-36 列 出 了 


浮 点数 表 示 的 四 种 特殊 值 以 及 它们 的 位 0 全 0 全 0 
模式 。 非 规格 化 数 全 0 非 0 

无 穷 大 用 于 表示 溢出 区 的 值 。 如 果 运 无 穷 大 全 1 40 
算 结果 溢出 ， 那 么 就 存储 无 穷 大 的 位 模 非 数 全 1 ay 


式 。 如 果 再 对 这 个 位 模式 执行 运算 ， 结 果 
就 是 预期 的 值 一 一 无 穷 。 例 如 ，3/co=0， 
5+oo=u， 而 无 穷 大 的 平方 根 是 无 穷 大 。 
除 以 0 会 得 到 无 穷 大 ， 例 如 ，3/0=，-4/0=-o。 如 果实 数 做 计算 得 到 无 穷 大 ,那么 就 可 以 
知道 某 个 中 间 结 果 发 生 了 洲 出 。 

如 果 一 个 值 不 是 一 个 数 ( 即 ， 非 数 )， 它 的 位 模式 称 为 NaN。 用 NaN 来 表示 非法 的 浮 点 
运算 ,例如 ， 取 负数 的 平方 根 得 到 NaN，0/0 也 得 到 NaN。 任 何 至 少 有 一 个 NaN 操作 数 的 
浮 点 运算 都 得 到 NaN， 例 如 ，7+NaN=NaN，7/NaN=NaN。 

无 穷 大 和 NaN 的 位 模式 都 使 用 了 阶 码 的 最 大 正 值 ， 即 阶 码 字段 是 全 1。 无 穷 大 的 尾数 
为 全 0，NaN 的 尾数 可 以 是 任何 非 零 模式 。 把 这 些 位 模式 保留 给 无 穷 大 和 NaN 会 减少 可 以 
存储 的 值 的 范围 。 对 于 3 位 阶 码 和 4 位 尾数 来 说 ， 最 大 数值 的 位 模式 和 它们 的 十 进 制 值 是 

1 111 0000 (bin)=—% 
1 110 1111 (bin) =—15.5(dec) 
0 110 1111 (bin)=+15.5(dec) 
0 111 0000 (bin)=+eo 

在 图 3-35 中 ， 上 溢出 区 的 无 穷 大 值 ， 没 有 对 应 的 下 滋 区 的 无 穷 小 值 。 取 而 代 之 的 是 用 
一 组 被 称 为 非 规格 化 数 的 值 来 缓解 下 滋 问 题 。 图 3-37 给 出 了 3 位 阶 码 ，4 位 尾数 的 二 进 制 
表示 下 的 浮 点 数 比例 图 ， 图 中 上 方 数 轴 是 没有 非 规格 化 数值 的 ， 下 方 数 轴 是 有 非 规格 化 数值 
的 。 该 图 显示 了 阶 码 字段 为 000，001 和 010 ( 余 3 码 ) 的 三 个 完整 数值 序列 ， 这 些 阶 码 分 别 
对 应 -3，-2 和 -1 (dec). 


图 3-36 浮 点 数 表示 的 特殊 值 
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+0.0 0.125 0.25 0.5 1.0 


图 3-37 


对 于 一 般 的 规格 化 数 ， 连 续 数 值 之 间 的 差 值 随 着 阶 码 单 位 的 增加 而 加 倍 。 例 如 ， 在 上 方 
数 轴 上 ，0.125 到 0.25 之 间 的 16 个 值 对 应 的 是 用 二 进 制 科学 记 数 法 写 出 的 数字 乘 以 2 ;而 
0.25 和 0.5 之 间 的 16 个 值 之 间 的 距离 增加 为 两 倍 ， 对 应 的 是 用 二 进 制 科学 记 数 法 写 出 的 数 
FRUI 27. 

如 果 没 有 非 规格 化 特殊 值 ，+0.0 和 最 小 的 正 值 之 间 的 差 值 与 最 小 序列 中 的 差 值 相 比 就 太 
大 了 。 非 规格 化 特殊 值 使 得 第 一 个 序列 的 连续 值 之 间 的 间隔 等 于 第 二 个 序列 连续 值 之 间 的 间 
隔 。 当 从 右边 接近 +0 时 ， 这 些 值 是 均匀 分 布 的 。 在 图 中 未 显示 的 左 半 部 分 数 轴 上 ， 当 从 左 
边 接近 -0.0 时 ， 这 些 负 值 也 是 均匀 分 布 的 。 

非 规格 化 数值 的 这 种 行为 被 称 为 逐 级 下 浇 (gradual overflow). A TEA Ft, BME 
EA 0 之 间 的 差距 减 小 了 很 多 。 其 主要 思想 是 ， 选 取 那 些 阶 码 字段 全 0 ( 余 码 表示 ) 的 非 零 
值 ， 把 它们 平均 分 布 在 下 溢 区 中 。 

因为 阶 码 字段 全 0 是 为 非 规格 化 数 保留 的 ， 所 以 最 小 正规 格 化 数 是 

0 001 0000=1.000 x 2* (bin) =0.25 (dec) 
如 果 阶 码 字 有 段 可 以 是 000， 那 么 最 小 正规 格 化 数 是 0.132 812 5， 我 们 现在 的 做 法 似乎 把 事情 
弄 得 更 糟 了 。 但 是 ， 非 规格 化 数值 分 布 在 原来 表示 方法 的 下 汶 区 间 内 ， 实 际 上 是 减 小 了 下 洪 
区 的 大 小 。 

当 阶 码 字段 全 是 0、 尾数 至 少 包 含 一 个 1 时 ， 要 使 用 特殊 的 表示 规则 。 若 阶 码 是 3 位 ， 
尾数 是 4 位 ， 

e 假定 二 进 制 小 数 点 左边 的 隐藏 位 为 0， 而 不 是 1。 

e 假定 阶 码 以 余 2 码 而 不 是 余 3 码 的 形式 存储 。 

对 于 3 位 阶 码 .4 位 尾数 的 表示 方法 来 说 , 0 000 0110 表示 的 十 进 制 数 是 多 少 ? 
因为 阶 码 是 全 0， 尾 数 至 少 包含 一 个 1， 所 以 这 个 数 是 非 规格 化 数 ， 它 的 阶 码 是 000 (42) 
=0-2=-2， 它 的 隐藏 位 是 0， 所 以 它 的 二 进 制 科学 记 数 表示 是 0.0110 x 2 “。 因 为 这 是 非 规格 
化 数 的 特殊 情况 ， 所 以 阶 码 以 余 2 码 而 不 是 余 3 码 表示 。 将 这 个 二 进 制 值 转换 为 十 进 制 ， 得 
到 0.093 75. a 

这 样 的 表示 会 让 下 溢 区 的 表示 变 得 更 好 。 计 算 具 有 最 小 数值 的 数 ， 它 是 非 规格 化 的 。 

1 000 0001 (bin)=—0.015625 (dec) 
1 000 0000(bin) =— 0.0 
0 000 0000 (bin)=+0.0 
0 000 0001 (bin)=+0,015625 (dec) 

如 果 没 有 非 规格 化 数 ， 最 小 正 数 是 0.132 812 5， 因 此 实际 上 下 溢 区 变 小 了 很 多 。 

图 3-38 展示 了 具有 所 有 4 种 特殊 值 的 3 位 阶 码 和 4 位 尾数 表示 法 的 一 些 重要 值 。 这 些 
值 按照 数字 从 小 到 大 的 顺序 排列 。 图 3-38 表明 为 什么 要 用 余 码 来 表示 浮 点 数 的 阶 码 。 和 忽略 
符号 位 ， 只 考虑 从 0.0 到 +o 的 正 数 。 可 以 看 到 ， 如 果 把 最 右边 的 7 位 看 作 一 个 简单 的 无 符 


号 整数 ,那么 从 表示 0 的 000 0000 到 表示 æ AY 111 0000， 相 邻 的 值 都 是 加 1。 如 果 对 两 
个 浮 点 数 进行 比较 ， 比 如 这 样 一 条 C 语句 


if (x < y) 


那么 计算 机 不 需要 提取 阶 码 字 段 或 者 插入 隐藏 位 ， 只 需要 把 最 右边 7 位 当 作 整数 ， 进 行 
比较 ， 就 能 判断 哪个 浮 点 数 有 更 大 的 数值 。 整 数 运算 的 电路 要 比 浮 点 数 运算 的 电路 快 很 多 ， 
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负 无 穷 大 1111 0000 -%0 

规格 化 负数 11101111 -1.1111 x 2 -15.5 
1110 1110 —1.1110 x 2 -15.0 
1 011 0001 —1.0001 x 2° —1.0625 
1011 0000 —1.0000 x 2° -1.0 
10101111 -1L1111 x 27 ~0.96875 
1 001 0001 —1.0001 x 2° —0.265625 
1 001 0000 —1.0000 x 27 —0.25 

非 规格 化 负数 1000 1111 -0.1111 x 27 =0.234375 
1 000 1110 —0.1110 x 2° -0.21875 
1 000 0010 —0.0010 x 27 —0.03125 
1 000 0001 一 0.0001 x 27 —0.015625 

负 0 1 000 0000 —0.0 

正 0 0 000 0000 +0.0 

非 规格 化 正 数 0 000 0001 0.0001 x 27 0.015625 
0 000 0010 0.0010 x 2° 0.03125 
0 000 1110 0.1110 x 2° 0.21875 
0 000 1111 0.1111 x 2° 0.234375 

规格 化 正 数 0 001 0000 1.0000 x 27 0.25 
0.001 0001 1.0001 x 2° 0.265625 
00101111 “Lan x 27 0.96875 
0.011 0000 1.0000 x 2° 1.0 
0011 0001 1.0001 x 2° 1.0625 
0110 1110 1.1110 x 2° 15.0 
0110 1111 1.1111 x 2? 15.5 

正 无 穷 大 0 111 0000 +00 

非 数 0111 F 


E 3-38 阶 码 3 位， 尾数 4 位 的 浮 点 数值 
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对 于 负数 ， 也 有 同样 的 模式 。 可 以 把 最 右 的 7 位 看 作 无 符号 整数 ， 用 以 比较 负数 的 数值 
大 小 。 如 果 阶 码 用 补 码 表示 ， 泽 点 数 就 不 会 有 这 样 的 属性 。 

图 3-38 显示 -0.0 和 +0.0 是 不 同 的 。 在 这 种 底层 抽象 中 ， 负 0 存储 形式 与 正 0 不 一 样 。 
但 是 ， 高 层 抽 象 的 程序 员 期 望 实数 集中 只 有 一 个 0， 没 有 正 负 之 分 。 举 个 例子 ， 如 果 x 的 值 
计算 出 来 是 -0.0， 且 y 是 +0.0， 那 么 程序 员 就 希望 x 的 值 是 0，y 的 值 也 是 0， 而 表达 式 (x 
<y) 为 假 。 在 这 特殊 情况 下 ， 即 使 位 模式 显示 x 是 负数 ，y 是正 数 ， 计 算 机 也 应 该 编程 返 
回 假 。 系 统 对 高 层 抽象 的 程序 员 隐 藏 了 这 一 事实 ， 即 在 底层 抽象 上 零 有 两 种 表示 。 

对 于 非 规 格 化 数 ， 要 从 十 进 制 转换 为 二 进 制 首先 需要 检查 该 十 进 制 数 是 否 在 非 规格 化 数 
范围 内 ， 以 便 决 定 其 表示 形式 。 由 图 3-38 可 知 ， 阶 码 为 3 位 ， 尾 数 为 4 位 时 ， 最 小 规格 化 
正 数 值 是 0.25。 任 何 小 于 0.25 的 数值 都 以 非 规 格 化 数 的 形式 存储 。 

对 于 3 位 阶 码 、4 位 尾数 的 表示 方法 来 说 ， 十 进 制 数值 -0.078 是 如 何 存储 的 ? 
由 于 0.078 小 于 0.25， 所 以 其 表示 是 非 规 格 化 的 ， 阶 码 全 0， 隐藏 位 为 0。 转 为 二 进 制 得 到 
0.078 (dec) =0.000100111…。 因 为 阶 码 是 全 0， 用 余 2 码 表 示 阶 码 ， 乘 数 必须 是 2“。 在 乘 
数 为 2” 的 二 进 制 科学 记 数 法 中 ，0.000100111…=0.0100111… x 2 一 。 如 同 所 预期 的 ， 小 数 点 
左边 是 0， 该 位 是 隐藏 位 。.0100111… 的 前 四 位 保存 到 尾数 字段 ， 并 舍 人 为 ,0101。 由 此 可 
得 ，-0.078 的 浮 点 数 表示 为 1000 0101。 机 


3.5.5 IEEE 754 浮 点 数 标 准 


电气 电子 工程 师 学 会 (IEEE) 是 一 个 由 会 员 支 持 的 专业 协会 ， 为 各 种 工程 领域 提供 服 
Z, 计算 机 工程 就 是 其 中 之 一 。 协 会 内 有 各 种 小 组 起 草 工业 标准 。 在 IEEE 提出 它 的 浮 点 数 
标准 之 前 ， 每 个 计算 机 厂商 都 设计 它们 自己 的 浮 点 数值 表示 法 ， 且 互 不 相同 。 在 网 络 普及 前 
的 早期 ， 计 算 机 之 间 的 数据 共享 很 少 ， 因 此 这 种 情况 尚 可 容忍 。 

即便 没有 大 量 的 数据 共享 需求 ， 标 准 的 缺失 也 阻碍 了 数字 计算 的 研究 和 发 展 。 在 两 台 不 
同 的 计算 机 上 运行 两 个 一 样 的 程序 ， 同 样 的 输入 可 能 产生 不 同 的 结果 ， 原 因 是 两 台 计 算 机 采 
用 了 不 同 的 近似 值 表 示 法 。 

1985 年 IEEE 设立 了 一 个 委员 会 来 起 草 浮 点 数 标 准 。 最 终 产生 了 两 个 标准 : 854 更 适用 
于 手持 计算 器 (与 其 他 计算 设备 相 比 )， 而 754 则 广泛 应 用 于 计算 机 。 该 标准 在 2008 年 作 了 
少许 修订 。 实 际 上 ， 现 在 每 个 计算 机 厂商 的 计算 机 中 的 浮 点 数 都 遵循 IEEE 754 标准 。 

在 本 节 前 面 讲述 的 浮 点 数 表 示 法 中 ， 除 了 阶 码 字 段 和 尾数 字段 的 位 数 不 同 之 外 ， 其 余 的 
都 和 IEEE 754 是 一 样 的 。 图 3-39 展示 了 这 个 标准 的 两 种 格式 。 单 精度 格式 阶 码 字段 是 8 位 
单元 ， 采 用 余 127 码 表示 (除了 非 规格 化 数 ， 它 们 使 用 余 126 码 )， 尾 数 是 23 位 。 这 种 格式 
对 应 于 C 语言 的 类 型 foat。 双 精度 格式 的 阶 码 字 段 是 11 位 单元 ， 采 用 余 1023 BRR ( 除 
了 非 规格 化 数 ， 它 们 使 用 余 1022 码 )， 尾 数 是 52 位 。 它 对 应 于 C HAMA double. 





位 1 8 23 
a) 单 精度 
内 | 
位 1 11 52 
b) 双 精 度 


图 3-39 IEEE754 浮 点 数 标准 
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有 下 列 单 精度 格式 的 位 值 ， 正 无 穷 大 是 

0 1111 1111 000 0000 0000 0000 0000 0000 
写成 4 位 一 组 的 全 32 位 模式 为 

0111 1111 1000 0000 0000 0000 0000 0000 

它 的 十 六 进 制 简化 表示 为 7F80 0000 (hex)。 最 大 的 正 值 为 

01111 1110 111 1111 1111 1111 1111 1111 
或 7F7F FFFF (hex)。 正 好 是 2“-2”“， 其 值 近似 是 2 或 3.4 x 10*。 最 小 的 规格 化 正 数 是 

0 0000 0001 000 0000 0000 0000 0000 0000 
或 0080 0000 (hex)。 正 好 是 2”*“， 近 似 于 1.2 x 10“。 最 小 的 非 规格 化 正 数 是 

0 0000 0000 000 0000 0000 0000 0000 0001 
或 0000 0001 (hex)。 正 好 是 2 ”， 近 似 于 14x10. 

一 47.25 的 单 精 度 浮 点 数 的 十 六 进 制 表 示 是 什么 ”整数 47 (dec) =101111 (bin), 
小 数 0.25 (dec) =0.01 (bin)， 因 此 47.25 (dec) =1.0111101 x 25。 这 个 数 是 负数 ， 因 此 第 一 
位 是 1， 阶 码 5 通 过 5+127=132 (dec) =1000 0100 ( 余 127) 转换 为 余 127 码 ， 尾 数 存储 二 
进 制 小 数 点 右边 的 0111101， 因 此 位 模式 是 

1 1000 0100 011 1101 0000 0000 0000 0000 
十 六 进 制 表 示 为 C23D 0000 (hex)。 a 

十 六 进 制 表示 为 3CC8 0000 的 二 进 制 科学 记 数 法 是 什么 ? 它 的 位 模式 为 

00111 1001 100 1000 0000 0000 0000 0000 
符号 位 是 0， 因 此 这 个 数 是 正 数 ， 阶 码 是 0111 1001 (4s 127) =121 (无 符号 ) =121-127 =-6 
(dec)， 尾 数 的 小 数 点 右边 是 1001， 隐 藏 位 为 1， 因此 这 个 数 是 1.1001 x 2“。 m 

十 六 进 制 表示 为 0050 0000 的 二 进 制 科学 记 数 法 是 什么 ” 它 的 位 模式 是 

0 0000 0000 101 0000 0000 0000 0000 0000 
符号 位 是 0， 因 此 它 是 正 数 ， 阶 码 字段 全 是 0， 因此 它 是 非 规格 化 数 ， 阶 码 0000 0000 (4 
126 ) =0 (无 符号 ) =0-126=-126 ( dec)， 隐 藏 位 是 0 而 不 是 1， 因 此 这 个 数 是 0.101 x 27%, 
@ 

双 精 度 格 式 具 有 更 大 的 表 数 范围 和 更 高 的 表 数 精度 ， 因 为 它 的 阶 码 字段 和 尾数 字段 更 
长 。 最 大 的 双 精 度 值 近似 于 2 ,或 1.8x10”“"。 最 小 的 规格 化 正 数 近似 于 2.2 x 10-， 最 
小 的 非 规格 化 数 近 似 于 4.9x 10%, 

图 3-37 展示 了 非 规格 化 特殊 值 ， 稍 微 修 改 一 下 就 适用 于 IEEE 754。 对 单 精 度 而 言 ， 
阶 码 字段 有 8 位 。 因 此 图 中 上 方 数 轴 的 三 个 序列 对 应 的 乘 数 就 是 2 、2 -和 2 ”。 尾 数字 
段 有 23 位， 那么 每 个 序列 就 有 2°=8 388 608 个 数值 ， 而 不 是 16 个 数值 。 没 有 发 生变 化 的 
是 ,每 个 序列 中 连续 值 之 间 的 距离 是 前 一 个 序列 连续 值 间距 的 两 倍 。 

对 双 精 度 而 言 ， 阶 码 字 段 有 11 位 。 因 此 图 中 上 方 数 轴 的 三 个 序列 对 应 的 乘 数 就 是 
208 21 A, BAFRA 52 位， 那么 每 个 序列 就 有 2°=4 503 599 627 370 496 个 
数值 ， 而 不 是 16 个 数值 。 对 非 规 格 化 数 ， 当 从 右边 接近 +0.0 时 ， 左 半 部 分 的 4.5 千 兆 
(quadrillion) 个 值 是 均匀 分 布 的 。 


3.6 ”模型 
模型 是 某 些 实体 系统 的 简化 表示 。 每 个 科学 领域 的 工作 人 员 ， 包 括 计算 机 科学 ， 构 建 模 
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型 并 研究 它们 的 性 质 ， 比 如 天 文学 家 构建 和 研究 的 一 些 太 阳 系 模型 。 

大 约 公元 前 350 年 ， 和 希腊 的 亚 里 士 多 德 提出 了 一 个 模型 ， 在 这 个 模型 中 ， 地 球 位 于 宇宙 
的 中 心 ， 环 绕 地 球 的 是 55 个 和 天球。 太阳、 月亮、 行星 和 恒星 每 个 都 在 一 个 天 球 上 环绕 天 空 。 

这 个 模型 和 现实 相符 的 程度 如 何 呢 ? 它 能 成 功 地 解释 天 空 的 形状 像 球 的 顶部 一 样 ， 也 能 
解释 行星 大 概 的 运行 。 千 百年 来 ， 亚 里 士 多 德 的 模型 被 认为 是 准确 的 。 

1543 年 ， 波 兰 天 文学 家 哥 白 尼 出 版 了 《De Revolutionibus 》( 天 体 运 行 论 )， 在 这 本 书 中 ， 
他 建立 了 以 太阳 为 中 心 的 太阳 系 模型 ,行星 围绕 太阳 做 圆周 运转 。 这 个 模型 比 地 心 模型 更 接 
近 实 体系 统 。 

16 世纪 后 期 ， 丹 麦 天 文学 家 Tycho Brahe 进行 了 一 系列 精确 的 天 文 观察 ， 这 些 观察 与 哥 
白 尼 的 模型 有 一 定 的 差异 。 然 后 , 1609 年 , Johannes Kepler 设想 了 一 个 模型 ， 在 这 个 模型 中 ， 
地 球 和 所 有 行星 围绕 太阳 运行 ， 但 轨道 不 是 圆 形 而 是 扁平 的 圆 形 ( 即 椭 圆 形 )。 这 个 模型 成 
功 地 详细 解释 了 Tycho Brahe 观察 到 的 行星 的 复杂 运行 。 

上 述 每 一 个 模型 都 是 太阳 系 的 一 个 简化 表示 。 没 有 一 个 模型 能 够 完全 精确 地 描述 真实 的 
物理 世界 。 现 在 我 们 知道 ， 根 据 爱 因 斯 坦 的 相对 论 ， 甚 至 Kepler 的 模型 也 是 一 个 近似 模型 。 
没有 模型 是 完美 的 ， 每 个 模型 都 是 现实 世界 的 一 个 近似 。 

当 信息 在 计算 机 存储 器 中 表示 时 ， 这 个 表示 也 仅仅 是 一 个 模型 。 如 同 太阳 系 的 每 个 模型 
描述 真实 系统 的 某 个 方面 比 其 他 方面 更 加 精确 一 样 ， 一 种 表示 方法 描述 信息 的 某 个 性 质 比 其 
他 性 质 更 精确 。 

例如 ， 正 整数 的 一 个 性 质 是 有 无 穷 大 的 数 。 不 管 你 写 一 个 多 大 的 整数 ， 别 人 总 能 写 出 更 
大 的 数 。 计 算 机 的 无 符号 二 进 制 表示 不 能 很 精确 地 描述 这 个 性 质 ， 因 为 内 存 中 存储 整数 的 空 
间 大 小 是 有 限制 的 。 

我 们 知道 =1.4142136... 是 无 限 不 循环 的 。 存 储 实数 的 表示 方法 是 一 个 模型 ， 对 于 像 2 
的 平方 根 这 样 的 数 ， 它 只 能 存储 近似 数 ， 它 不 能 准确 地 表示 2 的 平方 根 。 由 于 模型 的 限制 ， 
计算 机 在 任何 时 候 解决 问题 总 是 会 涉及 近似 。 

计算 机 能 模型 化 各 种 实体 系统 一 一 库存 清单 、 国 民 经 济 、 账 务 系统 和 生物 种 群 系统 ， 不 
一 而 足 。 在 计算 机 科学 中 ， 要 模型 化 的 通常 是 计算 机 本 身 。 

实际 上 ， 计 算 机 仅 有 的 实体 部 分 是 在 LG1 层 。 从 本 质 上 说 ， 计 算 机 只 是 一 个 复杂 的 、 
有 组 织 的 大 量 电路 和 电子 信号 。 在 ISA3 层 ， 高 电 平 信号 被 建 模 为 1， 低 电 平 信号 被 建 模 为 
0。ISA3 层 的 程序 员 在 使 用 模型 时 ， 不 需要 知道 电子 电路 和 信号 。 记 住 在 ISA3 层 ， 单 词 
Tom 用 1 和 0 表示 为 

101 0100 

110 1111 

110 1101 

HOL6 层 的 程序 员 在 使 用 模型 时 ， 不 需要 知道 位 。 实 际 上 ， 在 任何 层 ， 对 计算 机 编程 只 
需 了 解 那 一 个 层 的 计算 机 模型 知识 即 可 。 

HOL6 层 的 程序 员 可 以 把 计算 机 建 模 为 C 机 器 ， 这 个 模型 接受 C 程序 并 用 它 来 处 理 数 
据 。 当 程序 员 指 示 机 器 


printft ("Tom") ; 


他 不 需要 考虑 计算 机 在 ISA3 层 怎 样 被 建 模 为 二 进 制 机 器 。 类 似 地 ， 当 ISA3 层 程序 员 写 位 


序列 时 ， 他 无 须 考 虑 在 LG1 层 计 算 机 怎样 被 建 模 为 电路 的 组 合 。 

这 种 逐 级 为 计算 机 系统 建 模 的 方法 并 不 是 计算 机 科学 独 有 的 。 考 虑 一 个 有 6 个 分 公司 分 
布 全 国 的 大 公司 ,公司 总 裁 的 模型 是 6 个 分 公司 ， 每 个 分 公司 有 一 个 副 总 裁 向 他 汇报 ， 他 通 
过 看 每 个 分 公司 的 业绩 来 看 全 公司 的 业绩 。 当 要 求 产品 部 门 增加 利润 时 ， 他 无 须 考虑 产品 部 
门 副 总 裁 的 模型 。 当 副 总 裁 给 产品 部 门 的 每 个 小 部 门 经 理 下 达 命 令 时 ， 他 无 须 考虑 小 部 门 经 
理 的 模型 。 让 总 裁 亲自 处 理 小 部 门 层 的 事务 几乎 是 不 可 能 的 ， 整 个 公司 有 太 多 小 部 门 层 的 细 
节 ， 不 可 能 由 一 个 人 去 管理 。 

App7 层 的 计算 机 用 户 就 像 总 裁 ， 他 给 HOL6 层 的 程序 员 写 的 程序 发 出 诸如 “计算 所 有 
大 二 学 生 的 平均 分 ”的 指令 ， 他 无 须 考 虑 HOL6 层 模 型 怎样 发 布 指令 。 最 终 ， 这 条 App7 层 
上 令 逐 层 向 下 传送 到 LG1 层 。 最 终结 果 是 App7 层 的 用 户 能 够 用 非常 简化 的 计算 机 模型 控制 
大 量 的 电子 电路 和 信号 。 
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二 进 制 数 只 可 能 是 两 个 数值 之 一 。 在 机 器 层 上 ， 计 算 机 以 二 进 制 形 式 存储 信息 。 位 是 二 
进 制 数字 ， 不 是 0 就 是 1。 非 负 整数 使 用 无 符号 二 进 制 表示 。 最 右 位 是 1 的 位 置 ， 它 左边 的 
一 位 是 2 的 位 置 ， 再 左边 一 位 是 4 的 位 置 ， 以 此 类 推 ， 每 一 位 的 位 置 值 都 是 其 右边 一 位 位 置 
值 的 两 倍 。 有 符号 整数 采用 补 码 表 示 ， 其 中 第 一 位 是 符号 位 ， 剩 余 的 位 决定 该 数 的 数值 大 
小 。 对 于 正 数 来 说 ， 补 码 表示 与 无 符号 表示 相同 ; 而 对 于 负数 来 说 ， 它 的 补 码 可 以 通过 对 应 
正 数 的 反 码 加 1 得 到 。 

每 个 二 进 制 整数 ， 无 论 有 符号 还 是 无 符号 ， 都 有 表 数 范围 ， 这 是 由 内 存单 元 的 位 数 决 定 
的 。 单 元 的 位 数 越 小 ， 表 数 范 围 就 越 有 限 。 进 位 位 C 用 来 标识 无 符号 整数 是 否 超出 表 数 范 
围 ， 而 溢出 位 V 用 来 标识 补 码 表示 的 数 是 否 超出 表 数 范围 。 二 进 制 整数 的 运算 包括 ADD, 
AND, OR, XOR fil NOT, ASL 表示 算术 左 移 ， 实 际 上 是 对 一 个 二 进 制 值 乘 以 2 ; 而 ASR 
表示 算术 右 移 ， 是 对 一 个 二 进 制 数 除 以 2。 

十 六 进 制 数 系统 ， 基 数 为 16， 提 供 了 一 种 简洁 的 表示 位 模式 的 方法 。 十 六 进 制 的 16 个 
WFO. 1. 2. 3, 4. 5, 6. 7, 8. 9, AY BY C, D, ERF 一 个 十 六 进 制 数字 表示 4 
位 。 美 国信 息 交 换 标准 代码 ， 人 简称 ASCII， 是 一 种 存储 字符 的 常见 编码 方式 。 它 是 一 种 7 位 
编码 ， 可 以 表示 128 个 字符 ,包括 英语 字母 表 的 大 小 写字 母 、 十 进 制 数字 、 标 点 符号 和 不 可 
打印 的 控制 字符 。Unicode 字符 集 扩 展 了 ASCI 码 ， 履 盖 了 全 世界 的 语言 。 

浮 点 数 的 存储 单元 包括 3 个 字段 : 1 位 的 符号 字段 、 阶 码 字 段 和 尾数 字段 。 除 了 特殊 数 
值 外 ， 数 字 以 二 进 制 科学 记 数 法 方式 存储 ， 二 进 制 小 数 点 左边 的 隐藏 位 假定 为 1。 阶 码 以 余 
码 表 示 方 式 存储 。4 个 特殊 值 是 零 、 无 穷 大 、NaN 和 非 规格 化 数 。IEEE 754 标准 将 阶 码 和 
尾数 字段 的 位 数 定义 为 单 精 度 8 位 和 23 位 ， 双 精度 11 和 52 位 。 

各 个 抽象 层次 的 基本 问题 是 待 处 理 信息 的 形式 与 表达 它 的 语言 之 间 的 不 匹配 。 机 器 语言 
书写 的 程序 处 理 位 ， 高 级 语言 书写 的 程序 处 理 数组 和 记录 这 样 的 对 象 。 无 论 程序 写 在 哪个 层 
次 上 ， 信 息 必 须 装 进 某 种 语言 能 够 识别 的 格式 中 。 将 信息 和 语言 进行 匹配 是 所 有 抽象 层次 上 
的 基本 问题 ， 也 是 解决 问题 的 建 模 过 程 中 近似 产生 的 根源 。 


练习 
3.1 节 
*1. 数 出 下 列 数字 后 面 的 10 个 数 。 
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(a) 八进制 从 267 开始 ， 
(b) 三 进 制 从 2102 开始 ， 
(c) 二 进 制 从 10101 开始 ， 
(d) 五 进 制 从 2433 开始 。 
2. 数 出 下 列 数字 后 面 的 10 个 数 

(a) 八进制 从 466 开始 ， 
(b) 三 进 制 从 1201 开始 ， 
(c) 二 进 制 从 11011 开始 ， 
(d) 五 进 制 从 3434 开始 。 

*3. 将 下 列 数字 从 二 进 制 转换 到 十 进 制 ， 假 定 是 无 符号 二 进 制 表示 : 
(a) 10010 (b) 110 (c) 1011 


(d) 1000 (e) 11111 (f) 1010101 
4. 将 下 列 数字 从 二 进 制 转换 到 十 进 制 ， 假 定 是 无 符号 二 进 制 表 示 : 
(a) 10110 (b) 10 (c) 10101 


(d) 10000 (e) 1111 (f) 11110000 
*5. 将 下 列 数字 从 十 进 制 转换 到 二 进 制 ， 假 定 是 无 符号 二 进 制 表示 : 


(a) 25 (b) 16 (c) 1 (d) 14 (e)5 (f) 41 
6. 将 下 列 数字 从 十 进 制 转换 到 二 进 制 ， 假 定 是 无 符号 二 进 制 表示 : 
(a) 12 (b)35 (c)3 (d)0 (e)27 (f) 16 
7. 采用 无 符号 二 进 制 表示 ， 下 列 单元 用 二 进 制 和 十 进 制 表示 的 表 数 范围 是 什么 ? 
*(a) 2 位 单元 * (b) 3 位 单元 (c) 4 位 单元 
(d) 5 位 单元 (e) n ŽI 
*8. 执行 下 面 的 无 符号 整数 加 法 和 运算， 假定 是 7 位 单元 。 显 示 进 位 位 的 结果 。 
(a) 010 1011 (b) 101 1001 
ADD 100 1001 ADD 0110111 
c= = 
(c) 111 1111 (d) 111 1111 
ADD 1111111 ADD 0000001 


C= C= 
9. 执行 下 面 的 无 符号 整数 加 法 运算 ,假定 是 9 位 单元 。 显 示 进 位 位 的 结果 。 


(a) 00100 1011 (b) 1 0001 1101 
ADD 01101 0001 ADD 01110 1000 
C= C= 

(c) 111111111 (d) 11111 1111 
ADD 00000 0001 ADD 111111111 


gE C= 
10. 根据 3.1 节 ， 你 可 以 通过 看 1 的 位 置 上 的 数字 来 确定 二 进 制 数 是 奇数 还 是 偶数 ， 这 个 规则 对 任何 基 
数 都 可 能 吗 ? 请 解释 。 
11. 八进制 和 十 进 制 之 间 的 转换 类 似 于 二 进 制 和 十 进 制 之 间 的 转换 。 
*(a) 写 出 图 3-4 所 示 的 八进制 数 70146 的 多 项 式 表示 。 
(b) 使 用 图 3-5 的 技巧 ， 把 7291 (dec) 转换 为 八进制 。 
12. 为 何 ISA3 层 的 程序 员 会 混淆 万 圣 节 (Halloween) 和 圣诞 节 (Christmas) ? 提示 : 31 (oct) 等 于 什么 ? 
3.2 4 
* 13. 将 下 列 数 从 十 进 制 转换 到 二 进 制 ， 假 定 用 7 位 补 码 二 进 制 表示 : 
(a)49 (b)-27 (c)0 
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(d)—64 (e)-1 (f)-2 
(g) 这 台 计 算 机 二 进 制 和 十 进 制 的 表 数 范围 是 什么 ? 
14. 将 下 列 数 从 十 进 制 转换 到 二 进 制 ， 假 定 用 9 位 补 码 二 进 制 表示 ; 
(a)51 (b)-29 (c)-2 
(d)0 (e)-256 (f)-1 
(g) 这 台 计 算 机 二 进 制 和 十 进 制 的 表 数 范围 是 什么 ? 
*15. 将 下 列 数 从 二 进 制 转换 到 十 进 制 ， 假 定 是 7 位 补 码 二 进 制 表示 : 


(a)001 1101 (b)101 0101 (c) 111 1100 
(d) 000 0001 (e) 100 0000 (f) 100 0001 
16. 将 下 列 数 从 二 进 制 转换 到 十 进 制 ， 假 定 是 9 位 补 码 二 进 制 表示 : 
(a)0 0001 1010 (b)10110 1010 (c)1 1111 1100 
(d) 0 0000 0001 (e) 1 0000 0000 (£) 1 0000 0001 
*17. 执行 下 面 的 加 法 运算 ， 假 定 是 7 位 补 码 二 进 制 表示 。 显 示 状 态 位 的 结果 : 
(a) 010 1011 (b) 111 1001 
ADD 000 1110 ADD 000 1101 
N= N= 
Z= Z= 
y= v= 
C= C= 
(c) 100 0110 (d) 110 0001 
ADD 101 0101 ADD 111 0101 
N= N= 
Z= Z= 
y= y= 
Gc ce 
(e) 000 1101 (f) 100 1001 
ADD 011 0100 ADD 010 1011 
N= N= 
Z= Z= 
v= v= 
c= C= 
18. 执行 下 面 的 加 法 运算 ,假定 是 9 位 补 码 二 进 制 表示 。 显 示 状 态 位 的 结果 : 
(a) 01010 1100 (b) 111100101 
ADD 00011 1010 ADD 00011 0101 
N= N= 
Z= Z= 
y= y= 
C= C= 
(c) 1 0001 1011 (d) 1 1000 0101 
ADD 10101 0100 ADD 1 1101 0110 
N= N= 
Z= Z= 
y= V= 
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(e) 0 0011 0100 (f) 10010 0111 
ADD 01101 0010 ADD 0 10100111 
N= Nooo 
Z= i= 
y= V= 
C= C= 
19. 用 补 码 二 进 制 表示 ， 下 列 单元 二 进 制 和 十 进 制 表 数 范围 是 什么 ? 
*(a) 2 位 单元 (b) 3 位 单元 (c) 4 位 单元 
174 (d) 5 位 单元 (e) nn 位 单元 
3.3% 
*20. 假定 是 7 位 单元 ， 执 行 下 面 的 逻辑 运算 ; 
(a) 010 1100 (b) 000 1111 
AND 110 1010 AND 101 0101 
N= N= 
Z= Z= 
(c) 010 1100 (d) 000 1111 
OR 1101010 OR 1010101 
Z= Z= 
(e) 010 1100 (£) 000 1111 
XOR 1101010 XOR 101 0101 
N= N= 
Z= Z= 
(g) NEG 010 1100 (h) NOT 1101010 
21. 假定 是 9 MAJ, WIT F Ae eS 
(a) 0 1001 0011 (b) 0 0000 1111 
AND 10111 0101 AND 10111 0101 
N= - °° 
Z= Z= 
(c) 0 1001 0011 (d) 0 0000 1111 
OR 101110101 OR 101110101 
Z= Z= 
(e) 0 1001 0011 (f) 0.0000 1111 
XOR 10111 0101 XOR 10111 0101 
N= ts N= CO” 
z= Z= 
(g) NEG 11001 0011 (h) NOT 101110101 


*22. 假定 是 7 位 补 码 二 进 制 表 示 ， 将 下 列 数字 从 十 进 制 转换 到 二 进 制 ， 给 出 ASL 运算 的 结果 ， 再 把 它 
转换 回 十 进 制 。 用 ASR 运算 再 做 一 次 。 
(a)24 (b) 37 (c)—26 
(d) 1 (e)0 (f)-1 
23. 假定 是 9 位 补 码 二 进 制 表示 ， 将 下 列 数字 从 十 进 制 转换 到 二 进 制 ， 给 出 ASL 运算 的 结果 ， 再 把 它 
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转换 回 十 进 制 。 用 ASR 运算 再 做 一 次 。 

(a)94 (b) 135 (c)— 62 

(d)1 (e)0 (oJ 
24.(a) 写 出 8 位 单元 算术 右 移 的 RTL 描述 。(b) 写 出 8 位 单元 算术 左 移 的 RTL 描述 。 
*25. 假定 是 7 位 单元 ， 给 定 C 位 的 初始 值 ， 给 出 下 列 各 数 的 循环 位 移 运算 结果 : 


(a)C=1, ROL 010 1101 (b)C=0, ROL 010 1101 
(c)C=1, ROR 010 1101 (d)C = 0, ROR 010 1101 

26. 假定 是 9 位 单元 ， 给 定 C 位 的 初始 值 ， 给 出 下 列 各 数 的 循环 位 移 运算 结果 : 
(a)C =1, ROL 0 0110 1101 (b)C =0, ROL 0 0110 1101 
(c)C= 1, ROR 0 0110 1101 (d)C =0, ROR 0 0110 1101 


27.(a) BH 8 位 单元 循环 右 移 的 RTL 描述 。(b) 写 出 8 位 单元 循环 左 移 的 RTL 描述 。 
3.4 节 


28. 从 下 面 的 数 开始 ， 往 后 数 5 个 十 六 进 制 数 : 
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*(a)3AB7 (b) 6FD (c) BOE 
29. 将 下 列 十 六 进 制 数 转换 到 十 进 制 ; 
* (a) 2D5E (b) 2F (c)7 
30. 本 章 提 到 了 从 十 进 制 到 十 六 进 制 的 转换 方法 ， 但 是 没有 给 出 例子 。 采 用 该 方法 把 下 列 数 从 十 进 制 转 
换 到 十 六 进 制 : 
* (a) 26,831 (b) 4096 (c)9 


31. 把 十 进 制 数 转换 到 二 进 制 数 的 方法 稍 加 改动 ， 就 能 把 十 进 制 数 转换 到 任何 基数 。 
(a) 解释 从 十 进 制 转换 到 八进制 的 方法 。 
(b) 解释 从 十 进 制 转 到 基数 n 的 方法 。 

*32. 假定 是 7 位 补 码 二 进 制 表示 ， 将 下 面 的 数 从 十 六 进 制 转换 到 十 进 制 ， 记 得 要 检查 符号 位 : 
(a)5D (b)2F (c) 40 

33. 假定 是 9 位 补 码 二 进 制 表示 ， 将 下面 的 数 从 十 六 进 制 转换 到 十 进 制 ， 记 得 要 检查 符号 位 : 
(a) 1B4 (b) OFS (c) 100 

*34. 假定 是 7 位 补 码 二 进 制 表示 ， 写 出 下 面 十 进 制 数 的 十 六 进 制 位 模式 : 

(a)-27 (b) 63 (c)=1 

. 假定 是 9 位 补 码 二 进 制 表示 ， 写 出 下 面 十 进 制 数 的 十 六 进 制 位 模式 : 

(a)-73 (b)-1 (c) 94 

*36. 将 下 面 加 密 的 ASCII 消息 解码 (横着 读 )。 
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WN 


100 1000 110 0001 WEL 0120 110 0101 
010 0000 110 0001 010 0000 LPO 1110 
110 1001 110 0011 110 0101 010 0000 
110 0100 110 0001 LIX TOOL 010 0001 
37. 将 下 面 加 密 的 ASCII 消息 解码 (横着 读 )。 
100 1101 110 0101 110 0101 111 0100 
010 0000 110 0001 111 0100 010 0000 
110 1101 110 1001 110 0100 110 1110 
110 1001 110 OLTL 110 1000 111 0100 
010 1110 
*38. 下 面包 含 9 个 字符 的 字符 串 是 怎样 以 ASCI 码 存储 的 ? 
Pay $0.92 


39. 下 面包 含 13 个 字符 的 字符 串 是 怎样 以 ASCII 存储 的 ? 
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(321)497-0015 
40. 将 下 列 Unicode 码 位 转换 为 UTF-8 15: 


* (a) U4+0542， 亚 美 尼 亚 语 4 (b) U+2873， 点 字模 式 :: 
(c) U+4EB6, CIKILS FBS (d) U+13007, 埃及 象形 文字 区 
41. 解码 下 列 UTF-8 码 : 
(a) 56 6F 69 C3 A0 (b) 4B C3 A4 73 65 (c) 70 C3 A2 74 65 


42. 你 是 和 上 斯 洛 波 维 亚 打仗 的 下 斯 洛 波 维 亚 军队 的 首席 通信 官 ， 为 了 获得 斯 洛 波 维 亚 的 领地 ， 你 的 
间谍 将 潜入 敌人 的 指挥 中 枢 。 你 知道 上 斯 洛 波 维 亚 正在 策划 一 次 重要 的 攻击 ， 你 也 知道 下 列 情况 : 
(1) 攻击 的 时 间 是 日 落 或 日 出 , (2) 攻击 将 通过 陆地 、 空 中 或 者 大 海 , (3 ) 攻击 将 会 在 3 月 28, 
29、30、31 或 者 4 月 1 日 进行 。 你 的 间谍 必须 用 二 进 制 和 你 通信 ， 设 计 一 个 合适 的 二 进 制 编码 用 
来 传递 这 些 信息 ， 尽 可 能 使 用 最 少 的 位 数 。 

43. 有 时 候 八 进 制 用 于 代替 十 六 进 制 来 表示 位 序列 。 

* (a) 一 个 八进制 数 代表 多 少 位 ? 

在 下 面 的 单元 ， 如 何 用 八进制 来 表示 十 进 制 数 -13 ? 
(b) 15 位 单元 (c) 16 位 单元 (d) 8 位 单元 

3.5 节 

*44. 把 下 列 数 从 二 进 制 转换 到 十 进 制 : 

(a) 110.101001 (b) 0.000011 (c) 1.0 
45. 把 下 列 数 从 二 进 制 转换 到 十 进 制 : 

(a) 101.101001 (b) 0.000101 (c) 1.0 
*46. 把 下 列 数 从 十 进 制 转换 到 二 进 制 : 

(a) 13.15625 (b) 0.0390625 (c)0.6 
47. 把 下 列 数 从 十 进 制 转换 到 二 进 制 : 

(a) 12.28125 (b) 0.0234375 (c)0.7 

48. 做 一 个 类 似 图 3-33 的 表 ， 可 以 比较 4 位 单元 的 所 有 余 7 码 和 补 码 。 

49.(a) 用 余 7 码 表示 ，4 位 单元 以 二 进 制 和 十 进 制 表示 的 表 数 范围 是 什么 ? 
(b) HR 15 码 表示 ，5 位 单元 以 二 进 制 和 十 进 制 表示 的 表 数 范围 是 什么 ? 
(c) FAR 2-1 BRR, n 位 单元 以 二 进 制 和 十 进 制 表示 的 表 数 范围 是 什么 ? 

50. 假定 是 3 位 阶 码 字 段 和 4 位 尾数 字段 ， 写 出 下 列 十 进 制 值 的 位 模式 : 

*(a)-12.5 (b) 13.0 (c) 0.43 (d) 0.1015625 

51. 假定 是 3 位 阶 码 字段 和 4 位 尾数 字段 ， 下 面 位 模式 表示 的 十 进 制 值 是 什么 : 


*(a)0010 1101 (b) 1 101 0110 (c)1 111 1001 
(d)0 001 0011 (e) 1 000 0100 (f)0 111 0000 
52. 采用 IEEE 754 单 精度 浮 点 数 表 示 ， 写 出 下 面 十 进 制 值 的 十 六 进 制 表 示 : 
(a)27.1015625 (b)-1.0 (c)- 0.0 
(d)0.5 (e) 0.6 (f) 256.015625 
53. 采用 IEEE 754 单 精 度 浮 点 数 表示 ， 下 列 十 六 进 制 数 的 二 进 制 科 学 记 数 法 表示 是 什么 : 
* (a) 4280 0000 (b) B350 0000 (c) 0061 0000 
(d) FF80 0000 (e) 7FE4 0000 (f) 8000 0000 
54. 采用 IEEE 754 单 精 度 浮 点 数 表示 ， 写 出 下 列 数 的 十 六 进 制 表示 : 
(a) EẸ 


(b) 最 小 非 规 格 化 正 数 
(c) 最 大 非 规格 化 正 数 
(d) 最 小 规格 化 正 数 
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(e) 1.0 
(f) 最 大 规格 化 正 数 
(g) 正 无 穷 大 


55. 采用 IEEE 754 双 精 度 浮 点 数 表示 ， 写 出 下 列 数 的 十 六 进 制 表 示 : 


(a) EF 

(b) 最 小 非 规格 化 正 数 
(c) 最 大 非 规格 化 正 数 
(d) 最 小 规格 化 正 数 
(e) 1.0 

(f) 最 大 规格 化 正 数 
(g) 正 无 穷 大 
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3.1 Ë 
56. 用 C 语 言 写 一 个 程序 ， 输 入 一 个 4 位 八进制 数 ， 打 印 它 后 面 的 10 个 八进制 数 。 用 int 
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octNum[4]; 来 定义 一 个 八进制 数 ， 用 octrNum[0] 存储 最 高 的 ( 即 最 左 的 ) 八进制 位 , octNum[ 3] 
为 最 低 的 八进制 位 。 采 用 交互 式 输入 来 测试 你 的 程序 。 

:用 C 语 言 写 一 个 程序 ， 输 入 一 个 8 位 二 进 制 数 ， 打 印 它 后 面 的 10 个 二 进 制 数 。 用 int 
binNum[ 8]; 来 定义 一 个 八进制 数 ， 用 binNum[0] 存储 最 高 的 ( 即 最 左 的 ) 位 ，binNum[7] 为 
最 低位 。 请 用 户 输入 第 一 个 二 进 制 数字 ， 其 中 每 位 用 至 少 一 个 空格 分 开 。 

. 像 习 题 57 那样 定义 一 个 二 进 制 数 ， 编 写 一 个 函数 


int binToDec(const int bin[]) 


把 8 位 无 符号 二 进 制 数 转换 为 十 进 制 非 负 整数 。 不 要 在 函数 中 输出 十 进 制 整数 。 采 用 交互 式 输入 来 
测试 你 的 函数 。 
. 像 习 题 57 那样 定义 一 个 二 进 制 数 ， 编 写 一 个 函数 


void decToBin(int bin[], int dec) 


把 十 进 制 非 负 整数 转换 为 8 位 无 符号 二 进 制 数 。 不 要 在 函数 中 输出 二 进 制 数 。 采 用 交互 式 输入 来 测 
试 你 的 函数 。 
. 像 习 题 57 定义 二 进 制 数 那样 定义 sum, binl 和 bin2， 编 写 一 个 空 函数 
void binaryAdd(int sum[], int *cBit, 
const int binl[], const int bin2[]) 
来 计算 两 个 二 进 制 数 bin 1 和 bin2 的 和 sum. cBit 是 加 法 运算 后 进位 位 的 值 。 不 要 在 函数 中 输出 进 
位 位 与 和 数 。 采 用 交互 式 输入 来 测试 你 的 空 函 数 。 


3.25 
61. 像 习 题 57 那样 定义 一 个 二 进 制 数 ， 编 写 一 个 函数 


int binToDec (const int bin[]) 


把 8 位 补 码 二 进 制 数 转 换 为 十 进 制 有 符号 整数 。 不 要 在 函数 中 输出 十 进 制 整数 。 采 用 交互 式 输 入 来 
测试 你 的 函数 。 


62. 像 习题 57 那样 定义 一 个 二 进 制 数 ， 编 写 一 个 函数 


void decToBin(int bin[], int dec) 


把 十 进 制 有 符号 整数 转换 为 8 位 补 码 二 进 制 数 。 不 要 在 函数 中 输出 二 进 制 数 。 采 用 交互 式 输入 来 测 
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试 你 的 函数 。 
3.3 
63. RY RA 57 定义 二 进 制 数 那样 定义 bAnd、binl 和 bin2， 编 写 一 个 空 函 数 
void binaryAnd(int bAnd[], 
const int binl[], const int bin2[]) 
来 计算 两 个 二 进 制 数 binl 和 bin2 AY AND 运算 值 bAnd。 不 要 在 函数 中 输出 该 二 进 制 值 。 采 用 交互 
式 输入 来 测试 你 的 空 函数 。 
64. 使 用 OR 运算 为 习题 63 编写 一 个 空 函数 ， 并 重 命名 为 binaryOr()。 
65. 像 习 题 57 那样 定义 一 个 二 进 制 数 ， 编 写 一 个 函数 


void shiftLeft (int binNum[], int *cBit) 


来 对 binNum 执行 算术 左 移 运 算 ，cBit 是 位 移 后 的 进位 位 的 值 。 不 要 在 函数 中 输出 移 位 后 的 数 和 进 
位 位 。 采 用 交互 式 输入 来 测试 你 的 函数 。 

66. 使 用 算术 右 移 运算 为 习题 65 编写 一 个 函数 ， 并 重 命名 为 shiftRight()。 

3.4% 

67. 用 C 语 言 写 一 个 程序 ， 输 入 一 个 4 位 十 六 进 制 数 ， 打 印 它 后 面 的 10 个 十 六 进 制 数 。 用 int 
hexNum[4] 定义 一 个 十 六 进 制 数 ， 十 六 进 制 的 输入 不 论 大 小 写 ， 输 出 采用 大 写字 母 ， 例 如 ，3C6f 
是 合法 的 输入 ， 而 输出 应 为 3C6F，3C70，3C71…… 

68. 使 用 习题 67 中 十 六 进 制 数 的 定义 ， 编 写 一 个 函数 


int hexToDec (const int hexNum[] ) 


把 4 位 十 六 进 制 数 转换 为 十 进 制 非 负 整数 。 不 要 在 函数 中 输出 十 进 制 数 。 采 用 交互 式 输入 测试 你 的 
Pa. 
69. 使 用 习题 67 中 十 六 进 制 数 的 定义 ， 编 写 一 个 函数 


void decToHex(int hexNum[], int decNum) 


把 十 进 制 非 负 整数 转换 为 4 位 十 六 进 制 数 。 不 要 在 函数 中 输出 十 六 进 制 数 。 采 用 交互 式 输入 测 
试 你 的 函数 。 
70. 使 用 习题 67 中 十 六 进 制 数 的 定义 ， 编 写 一 个 函数 


int hexToDec (const int hexNum[] ) 


把 4 位 十 六 进 制 数 转换 为 十 进 制 有 符号 整数 。 不 要 在 函数 中 输出 十 进 制 数 。 采 用 交互 式 输入 测试 你 
的 函数 。 
71. 使 用 习题 67 中 十 六 进 制 数 的 定义 ， 编 写 一 个 函数 


void decToHex(int hex[], int dec) 


把 十 进 制 有 符号 整数 转换 为 4 位 十 六 进 制 数 。 不 要 在 函数 中 输出 十 六 进 制 数 。 采 用 交互 式 输入 测试 
你 的 函数 。 
72. 用 C 语言 编写 一 个 函数 ， 把 一 个 任意 基数 的 无 符号 数 转换 为 十 进 制 非 负 整数 。 例 如 ， 对 于 基数 为 6 
的 4 位 数字 ， 声 明 : 
const int base = 6; 
const int numDigits = 4; 
int number [numDigits] ; 
编写 函数 


void getNumber (int num[]) 


输入 任意 基数 的 无 符号 数 。 如 果 base 值 需要 ， 使 用 大 写字 母 输入 。 编 写 函数 


73. 


int baseToDec (const int num[]) 

将 这 个 任意 基数 的 数 转换 为 十 进 制 非 负 整数 。 必 须 能 够 通过 仅 改变 常量 base 就 可 以 修改 你 的 程序 ， 
使 其 用 于 其 他 不 同 基数 的 运算 ; 必须 能 够 通过 仅 改变 常量 numDigits 就 可 以 修改 程序 ， 使 其 用 于 不 
同 的 位 数 。 

采用 与 习题 72 一 样 的 声明 ， 编 写 函数 

void decToBase(int baseNum[], int decNum) 

将 十 进 制 非 负 整 数 转换 为 任意 基数 的 数 。 编 写 函 数 

void putNumber (const int baseNum[]) 

输出 任意 基数 的 无 符号 数 。 如 果 base 值 需要 ， 使 用 大 写字 母 输入 。 必 须 能 够 通过 仅 改 变 常量 base 
就 可 以 修改 你 的 程序 ， 使 其 用 于 其 他 不 同 基数 的 运算 ; 必须 能 够 通过 仅 改变 常量 numDigits 就 可 以 
修改 程序 ， 使 其 用 于 不 同 的 位 数 。 
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计算 机 体系 结构 





建筑 师 把 墙 、 门 和 天 花 板 这 些 部 件 组 合 在 一 起 形成 建筑 物 。 类 似 地 ， 计 算 机 架构 师 把 输 
和 设备、 内 存 和 CPU 寄存 器 组 合 在 一 起 形成 计算 机 。 

建筑 物 有 各 种 形状 和 大 小 ， 计 算 机 也 是 。 这 就 提出 一 个 问题 : 如果 我 们 选择 一 台 计 算 
机 ， 研 究 几 十 种 流行 的 可 用 模型 ， 那 么 当 这 些 模型 不 可 避免 地 被 生产 商 停 用 时 ， 我 们 的 知识 
多 多 少 少 都 会 有 些 过 时 。 同 样 ， 对 于 那些 使 用 我 们 没有 选择 研究 的 计算 机 的 人 ， 这 本 书 的 价 
值 也 会 较 低 。 

但 是 还 有 另 一 种 可 能 性 。 一 本 关于 建筑 学 的 书 可 以 观察 一 栋 假 想 的 建筑 物 ， 同 样 道 理 ， 
这 本 书 可 以 探索 一 台 虚 拟 的 计算 机 ， 这 台 虚 拟 计算 机 包含 类 似 于 能 在 所 有 真实 计算 机 上 找到 
的 特性 。 这 种 方法 有 它 的 优势 和 劣势 。 

虚拟 计算 机 的 一 个 好 处 是 它 可 以 被 设计 成 仅 用 以 说 明 适 用 于 大 多 数 计算 机 系统 的 基本 概 
念 ， 那 么 我 们 可 以 专注 于 要 点 而 不 用 理会 真实 计算 机 各 自 的 奇特 属性 。 专 注 于 基本 原理 也 能 
避免 知识 过 时 ， 市场 上 各 种 计算 机 来 来 去 去 ， 基 本 原理 总 会 继续 适用 。 

学 习 虚 拟 计算 机 的 主要 劣势 是 ， 它 的 一 些 细节 对 在 汇编 语言 层 或 指令 集 架构 层 使 用 特定 
真实 机 器 工作 的 人 来 说 关系 不 大 。 不 过 ， 如 果 理 解 了 基本 概念 ， 就 可 以 很 容易 地 学 会 任何 特 
定 机 器 的 细节 。 

对 于 这 个 两 难 困 境 没 有 100% 满意 的 解决 方案 。 我 们 选择 虚拟 计算 机 的 方法 是 因为 它 能 
够 阐释 基本 概念 。 我 们 假设 的 机 器 叫 作 Pep/9 计算 机 。 


4.1 硬件 


Pep/9 硬件 在 指令 集 架构 层 (ISA3 层 ) = 主 存储 器 
要 由 三 部 分 组 成 : 

o 中 央 处 理 单元 (CPU) 磁盘 中 央 处 理 单元 

。 具 有 输入 /输出 设备 的 主 存储 器 = 

。 人 磁盘 : 

图 4-1 的 框图 把 每 个 组 成 部 分 用 一个 方 框 ttt tri 
表示 。 总 线 是 连接 三 个 主要 组 成 部 分 的 一 组 线 系统 总 线 


路 ， 它 承载 方 框 之 间 传送 的 数据 信号 和 控制 aen 


信号。 图 4-1 Pep/9 计算 机 的 组 成 框图 
4.1.1 中 央 处 理 单元 


中 央 处 理 单元 (CPU) 包含 6 个 专用 内 存单 元 ， 叫 作 寄 存 器 。 如 图 4-2 所 示 ， 它 们 是 
© 4 位 状态 寄存 器 (NZVC) 
© 16 位 累加 器 (A) 
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16 位 变 址 寄存 器 (X) 
16 位 程序 计数 器 (PC) 
16 位 栈 指针 (SP) 
24 位 指令 寄存 器 (IR) 

状态 寄存 器 中 的 N、Z、V 和 C 
与 3.1 节 和 3.2 节 讨论 的 一 样 ， 分 别 中 央 处 理 单元 
是 负 、 零 、 湾 出 和 进位 位 。 累 加 器 是 
包含 运算 结果 的 寄存 器 。 接 下 来 的 3 状态 位 (NzVc) 
个 寄存 器 X、PC 和 SP， 帮助 CPU 访 累加 器 (A) 
问 主 存 中 的 信息 。 变 址 寄存 器 用 来 访 变 址 寄存 器 (20 
问 数 组 的 元 素 ， 程序 计数 器 用 来 访问 程序 计数 器 (pc) (TTT 
指令 ， 栈 指针 用 来 访问 运行 时 栈 上 的 
元 素 。 指令 寄存 器 保存 从 内 存 中 取出 。 | tm TTT] 
的 指令 。 

除了 这 6 个 寄存 器 外 ，CPU 还 
包含 执行 Pep/9 指令 的 所 有 电子 器 件 
(在 图 4-2 中 未 显示 )。 


4.1.2 主 存储 器 


图 4-3 展示 了 Pep/9 计算 机 的 主 
存储 器 。 它 包含 65 536 个 8 位 内 存 
单元 。 一 个 8 个 位 的 组 称 为 1 字 节 
(byte)。 类 似 于 邮箱 上 的 数字 地 址 ， 
每 字 节 都 有 一 个 地 址 ， 地 址 范围 以 十 
进 制 表示 是 从 0 ~ 65535， 十 六 进 制 
表示 是 从 0000 ~ FFFF。 主 存储 器 有 
时 称 为 核心 存储 器 。 

图 4-3 在 第 一 行 展示 了 主 存 的 前 
3 个 字 节 ， 第 二 行 是 接 下 来 的 字 节 ， 
再 下 一 行 是 接 下 来 的 3 个 字 节 ， 而 在 
最 后 一 行 是 最 后 2 个 字 节 。 把 一 行内 存 看 作 包含 1 个 、2 个 还 是 3 个 字 节 取决 于 问题 的 上 下 
文 。 有 时 候 ， 把 一 行 看 作 一 个 字 节 更 方便 ， 而 有 时 是 2 个 或 者 3 个 更 方便 。 当 然 ， 在 物理 计 
算 机 里 ，1 个 字 节 是 存储 于 电子 电路 中 的 8 个 信号 序列 。 字 节 在 物理 上 的 排列 不 会 像 图 中 所 
示 的 那样 。 

通常 如 图 4-4 所 示 的 那样 画 主 存 是 很 方便 的 ， 把 地 址 写 在 块 的 左边 。 尽 管 看 上 去 每 行 方 
框 的 宽度 相等 ,但 是 一 行 可 以 代表 1 个 字 节 或 者 几 个 字 节 。 方 框 边 上 的 地 址 是 本 行 最 左边 字 
节 的 地 址 。 

可 以 通过 地 址 序列 知道 一 行 包含 多 少 字 节 。 在 图 4-4 中 , 第 1 行 一 定 是 3 个 字 节 ， 因 为 
第 2 行 的 地 址 是 0003 ; 第 2 行 一 定 是 1 个 字 节 ， 因 为 第 3 行 的 地 址 是 0004， 比 0003 大 1。 
类 似 地 ,第 3 行 和 第 4 行 每 行 有 3 个 字 节 , 第 5 行 有 1 字 节 , 第 6 行 有 2 个 字 节 ， 从 图 4-4 


指令 寄存 器 (IR) | 


4-3 Pep/9 计算 机 的 主 存储 器 
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看 出 ， 不 可 能 知道 第 7 行 有 多 少 字 节 。 图 4-4 的 前 3 行 对 应 图 4-3 的 前 7 个 字 节 。 
无 论 在 纸 上 怎 么 画 主 存 字 节 ， 都 把 小 地 址 


的 字 节 称 为 内 存 的 顶部 ， 大 地 址 的 字 节 称 为 内 主 存储 器 
存 的 底部 。 0000 
大 多 数 计算 机 厂商 指定 一 个 字 是 一 定数 量 ata 
的 字 节 。 在 Pep/9 计算 机 中 ， 一 个 字 是 两 个 相 0007 
邻 字 节 ， 因 此 ， 一 个 字 包 含 16 位 。 在 Pep/9 000A 
CPU 中 的 大 多 数 寄 存 器 是 字 寄 存 器 。 在 主 存 Ta 


中 ， 一 个 字 的 地 址 是 这 个 字 第 一 个 字 节 的 地 址 。 es nary 
例如 ， 图 4-Sa 展示 了 地 址 为 000B 和 000C 的 eet fees 
两 个 相 邻 字 节 ， 这 个 16 位 字 的 地 址 是 000B。 图 44 另 一 种 描述 主 存储 器 的 方式 


区 别 内 存单 元 的 内 容 和 它 的 地 址 是 非常 重 
要 的 。Pep/9 计算 机 的 内 存 地 址 长 度 是 16 位 ， DOD 
因此 图 4-$a 中 字 的 二 进 制 地 址 是 0000 0000 
0000 1011， 但 是 位 于 这 个 地 址 的 字 的 内 容 是 eh ale 
0000 0010 1101 0001。 不 能 把 字 的 内 容 和 它 的 a) 二 进 制 表示 的 内 容 
地 址 搞 混 ， 它 们 是 不 同 的 。 

为 了 节约 纸 面 上 的 空间 ， 字 节 或 字 的 内 
容 通常 用 十 六 进 制 表示 。 图 4-5b 给 出 了 地 址 000B 000C 
000B 的 字 以 十 六 进 制 表示 的 内 容 。 在 机 器 语言 b) 十 六 进 制 表示 的 内 容 
代码 中 ， 给 出 一 组 字 节 的 第 一 个 字 节 的 地 址 ， 000B 02D1 
然后 给 出 十 六 进 制 表示 的 内 容 ， 如 图 4-Sc 所 c) 机 器 语言 代码 中 的 内 容 


示 。 用 这 种 格式 表示 ， 尤 其 容易 混 清 字 节 的 地 gas 内 存 位 置 的 内 容 与 其 地 址 之 间 的 差别 
址 和 它 的 内 容 。 

在 图 4-5 的 例子 中 ， 对 内 存单 元 的 内 容 有 
多 种 解读 方法 。 如 果 把 位 序列 0000 0010 1101 0001 看 作 补 码 表示 的 整数 ， 那 么 第 一 个 位 就 
是 符号 位 ， 这 个 二 进 制 序列 表示 十 进 制 数 721。 如 果 把 最 右边 7 位 看 作 ASCII BFE, RA 
这 个 二 进 制 序列 表示 字符 Q。 主 存 不 会 决定 以 何 种 方式 来 解读 这 个 字 节 ， 它 只 记录 二 进 制 序 
列 0000 0010 1101 0001. 


4.1.3 输入 /输出 设备 


你 可 能 想 知道 Pep/9 硬件 在 哪里 ， 你 能 不 能 真 的 接触 它 。 答 案 是 ， 这 个 硬件 根本 不 存 
在 ! 至 少 作为 一 台 物 理 机 器 它 是 不 存在 的 ， 不 过 作为 一 组 可 以 在 计算 机 系统 上 执行 的 程序 ， 
它 是 存在 的 。 这 些 程 序 模拟 这 些 章 节 描 述 的 Pep/9 虚拟 机 器 的 行为 。 

Pep/9 系统 模拟 两 种 输入 /输出 (IO) 模式 : 交互 式 和 批 处 理 。 在 执行 程序 之 前 ， 必 须 
指定 VO 模式 。 如 果 指 定 为 交互 式 , 输入 来 自 键盘 ,输入 和 输出 都 将 显示 在 终端 窗口 中 。 如 
果 指 定 为 批 处 理 ， 则 输入 来 自 输 入 窗口 ， 输 出 将 转 到 输出 窗口 。 批 处 理 模式 模拟 文件 的 输 
和 人 和， 因为 输入 窗口 在 程序 执行 之 前 就 必须 具有 数据 ， 就 像 输 入 文件 要 包含 程序 处 理 的 数据 
一 样 。 

Pep/9 模拟 了 一 种 通用 的 计算 机 系统 设计 ， 称 为 内 存 映 射 JO。 输 入 设备 以 一 个 固定 地 
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址 连接 到 主 存储 器 中 ， 输 出 设备 以 另 一 个 固定 地 址 连接 到 主 存储 器 中 。 在 Pep/9 中 ,输入 设 
备 的 地 址 是 FC15， 输 出 设备 的 地 址 是 FC16。 


4.1.4 数据 和 控制 


图 4-1 中 连接 方 框 的 实 线 是 数据 流 线 。 数 据 从 总 线 上 地 址 为 FC15 的 输入 设备 流向 
CPU， 也 可 以 从 CPU 流向 总 线 上 地 址 为 FC16 的 输出 设备 。 数 据 不 能 跳 过 CPU 直接 从 输入 
设备 流向 另 一 个 内 存 位 置 ， 也 不 能 跳 过 CPU 直接 从 其 他 内 存 位 置 流向 输出 设备 。 大 多 数 计 
算 机 系统 具有 被 称 为 直接 存储 器 访问 (DMA) 的 机 制 ， 它 允许 数据 直接 在 磁盘 和 主 存储 器 之 
间 流 动 而 不 经 过 CPU。 虽 然 这 种 设计 很 常见 ， 但 是 Pep/9 模拟 器 并 没有 提供 此 功能 。 

虚线 是 控制 线 。 控 制 信号 都 是 从 CPU 发 出 的 ， 也 就 是 说 ，CPU 控制 计算 机 的 所 有 其 
他 部 分 。 例 如 ， 要 使 数据 从 主 存 的 输入 设备 沿 着 实数 据 流 线 流 到 CPU, CPU 必须 沿 着 虚 控 
制 线 给 内 存 传送 一 个 发 送信 号 。 重 要 的 是 处 理 器 是 真正 的 中 心 ， 它 控制 计算 机 所 有 其 他 的 


41.5 ”指令 格式 


每 种 计算 机 都 有 它 自己 的 指令 集 ， 固 化 在 CPU 中 。 厂 商 之 间 的 指令 集 是 不 同 的 。 许 多 
厂商 生产 一 个 系列 的 型 号 ， 每 个 型 号 和 本 系列 中 其 他 型 号 具有 相同 的 指令 集 ， 但 是 同一 家 公 
司 制造 的 计算 机 指令 集 经 常 不 一 样 。 

Pep/9 计算 机 的 指令 集 有 40 条 指令 ， 如 图 4-6 所 示 。 一 条 指令 要 么 是 一 个 字 节 ， 称 为 指 
令 指 示 符 (instruction specifier)， 要 么 是 指令 指示 符 后 紧 跟 一 个 称 为 操作 数 指 示 符 ( operand 
specifier) 的 字 。 没 有 操作 数 指示 符 的 指令 叫 作 一 元 指令 。 图 4-7 给 出 了 非 一 元 指令 和 一 元 
指令 的 结构 。 





0000 0000 停止 执行 

0000 0001 从 CALL 返回 

0000 0010 从 陷阱 返回 

0000 0011 将 栈 指 针 (SP) 传送 到 累加 器 (A) 

0000 0100 将 NZVC 标志 传送 到 累加 器 的 位 12 一 位 15 (A<12..15>) 
0000 0101 将 累加 器 的 位 12 一 位 15 (A<12..15>) 传送 到 NZVC 标志 
0000 011r 寄存 器 了 按 位 取 反 

0000 100r 寄存 器 r 取 反 

0000 101r 寄存 器 上 算术 左 移 

0000 110r 寄存 器 r 算 术 右 移 

0000 111r 寄存 器 rz 循环 左 移 

0001 000r 寄存 器 r 循 环 右 移 

0001 001a 无 条 件 分 支 

0001 010a 如 果 小 于 等 于 分 支 

0001 Olla 如 果 小 于 分 支 

0001 100a 如 果 等 于 分 支 

0001 101a 如 果 不 等 于 分 支 

0001 110a 如 果 大 于 等 于 分 支 


图 4-6 Pep/9 的 ISA3 层 指令 集 
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t 5, tE? AT 


0001 111a 
0010 000a 
0010 001a 
0010 010a 
0010 011n 
0010 laaa 
0011 Oaaa 
0011 laaa 
0100 Oaaa 
0100 laaa 
0101 Oaaa 
0101 laaa 
0110 raaa 
0111 raaa 
1000 raaa 
1001 raaa 
1010 raaa 
1011 raaa 
1100 raaa 
1101 raaa 
1110 raaa 


1111 raaa 





如 果 大 于 分 支 

如 果 V 分 支 

如 果 C 分 支 

调用 子 例 程 

未 实现 操作 码 ， 一 元 陷阱 

未 实现 操作 码 ， 非 一 元 陷阱 

未 实现 操作 码 ， 非 一 元 陷阱 

未 实现 操作 码 ， 非 一 元 陷阱 

未 实现 操作 码 ， 非 一 元 陷阱 
KEME, ETC BABE 

加 到 栈 指针 (SP) 

从 栈 指针 (SP) 减 去 

加 到 寄存 器 

从 寄存 器 r 减 去 

与 寄存 器 T 按 位 与 

与 寄存 器 r 按 位 或 

将 一 个 字 与 寄存 器 tr 进行 比较 

将 一 个 字 节 与 寄存 器 r 位 8 一 位 15 (r<8..15>) 进行 比较 
从 主 存 装 人 一 个 字 到 寄存 器 

从 主 存 装 人 一 个 字 节 到 寄存 器 上 + 位 8 一 位 15 (r<8..15>) 
寄存 器 r 存储 到 主 存 字 中 
寄存 器 + 位 8 一 位 1$ (r<8..15>) 存储 到 主 存 字 节 中 


图 4-6 ( 续 ) 


8 位 指令 指示 符 分 为 多 个 部 分 。 第 一 部 分 叫 作 操作 码 ， 常 称 为 opcode。 操 作 码 是 4 一 8 
fz, 例如， 图 4-6 显示 了 把 栈 指针 移 到 累加 器 的 指令 有 8 位 操作 码 0000 0011， 而 SP 加 法 指 
令 有 5 位 操作 码 01010。 操 作 码 少 于 8 位 的 指令 ， 根 据 指令 的 不 同 ， 它 们 的 指令 指示 符 细 分 
为 多 个 字段 。 图 4-6 用 字母 a、r 和 n 来 标识 这 些 字段 ， 每 个 字母 可 以 为 0 或 1。 


指令 
操作 


a LETT 


数 


指示 符 


a) 非 一 元 指令 的 两 个 部 分 


指示 符 


b ) 一 元 指令 


图 4-7 Pep/9 指令 格式 


图 4-6 给 出 “如 果 等 于 分 支 ”指令 的 指令 指示 符 为 0001 100a。 因 为 字母 a 可 以 
为 0 或 1， 所 以 指令 有 两 种 版 本 : 0001 1000 和 0001 1001。 类 似 地 ， 十进制 输出 陷阱 指令 有 
8 种 版 本 ， 它 的 指令 指示 符 是 0011 laaa, aaa 可 以 是 从 000 到 111 的 任意 组 合 。 

图 4-8 总 结 了 字母 a 和 ?在 指令 指示 符 中 可 能 字段 的 含义 。 一 般 来 说 ， 字 母 a 代表 寻 址 
Fick, Her 代表 寄 存 器 。 当 rf 为 0 时 ， 指 令 对 累加 器 进行 操作 ， 当 rr 为 1 时， 指令 对 变 址 
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寄存 器 进行 操作 。Pep/9 的 非 一 元 指令 有 8 种 可 能 的 寻 址 方式 : 立即 数 、 直 接 、 间 接 、 栈 相 [91] 
对 、 栈 相对 间接 、 变 址 、 栈 变 址 和 栈 变 址 间接 ， 后 面 的 章节 会 描述 寻 址 方式 的 含义 。 目 前 ， 

只 需要 了 解 怎样 使 用 图 4-7 和 图 4-8 中 的 表格 来 确定 一 条 给 定 的 指令 使 用 的 是 什么 寄存 器 和 

寻 址 方式 。 一 元 陷阱 指令 中 字母 n 的 含义 将 在 后 面 的 章节 中 进行 描述 。 


aaa Suit yst as SH SERER Tae 
000 立即 数 0 立即 数 0 累加 器 ，A 
001 直接 1 变 址 1 变 址 寄存 器 ，X 
010 间接 b) a 寻 址 字段 c) 寄存 器 r 字 段 

oll 栈 相对 

100 栈 相对 间接 

101 变 址 

110 栈 变 址 

111 栈 间接 变 址 


a) aaa 寻 址 字段 
图 4-8 Pep/9 指令 指示 符 字 段 


GEM 确定 1100 1011 指令 的 操作 码 、 寄 存 器 和 寻 址 方式 。 从 左边 开始 ， 根 据 图 4-6， 
操作 码 是 1100， 操 作 码 后 面 的 1 位 是 5 位 ， 值 为 1， 表 示 变 址 寄存 器 , r 位 后 面 是 aaa 位， 
值 为 011 ， 表 示 栈 相对 寻 址 。 因 此 这 条 指令 使 用 栈 相 对 寻 址 方式 将 内 存 中 一 个 字 装 人 变 址 寄 
存 器 中 。 “ 

对 于 非 一 元 指令 ， 操 作 数 指示 符 表 明 指 令 要 处 理 的 操作 数 。 根 据 指令 指示 符 中 的 某 些 
fiz, CPU 有 多 种 不 同 的 解读 操作 数 指示 符 的 方法 。 例 如 ， 可 以 把 操作 数 指示 符 当 作 ASCII 
字符 、 补 码 表示 的 整数 或 者 存储 操作 数 的 主 存 地址 。 

指令 存储 于 主 存 中 ， 一 条 指令 的 地 址 是 该 指令 第 一 个 字 节 的 地 址 。 

GER 4 4-9 展示 了 存储 于 主 存 地址 01A3 和 01A6 的 两 条 相 邻 的 指令 ，01A6 的 指令 
是 一 元 指令 ，01A3 的 指令 则 不 是 。 

主 存储 器 


[olllillol] 00000011 01001110 


01A3 01A4 OLAS 


00001100 


01A6 





14-9 ” 主 存 中 的 两 条 指令 


在 这 个 例子 中 ，01A3 的 指令 表示 如 下 : 

操作 码 : 0111 

寄存 器 rr 字 段 ; 1 

寻 址 aaa 字段 : 101 

操作 数 指示 符 : 0000 0011 0100 1110 192 
这 里 ， 所 有 的 数 都 是 二 进 制 的 。 根 据 图 4-6 的 操作 码 表 ， 这 是 减法 指令 。 寄 存 器 rz 字段 表明 
要 操作 的 是 变 址 寄存 器 而 不 是 累加 器 。 这 条 指令 是 把 变 址 寄存 器 的 内 容 减 去 操作 数 。aaa 寻 
址 字段 表示 变 址 寻 址 ， 所 以 对 操作 数 指示 符 做 相应 的 解读 。 在 本 章 中 ， 我 们 的 学 习 仅 限于 直 
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接 寻 址 ， 其 他 模式 会 在 后 面 的 章节 中 讲解 。 
01A6 的 一 元 指令 表示 如 下 : 


操作 码 : 0000 110 

寄存 器 r FFL: 0 

操作 码 表示 这 条 指令 是 做 算术 右 移 ， 寄 存 器 r 字 段 表 明 要 进行 右 移 的 是 累加 器 。 因 为 这 
是 个 一 元 指令 ， 所 以 没有 操作 数 指示 符 。 = 


在 例 4.3 中 ， 下 面 的 指令 格式 称 为 机 器 语言 : 

0111 1101 0000 0011 0100 1110 

0000 1100 

机 器 语言 (machine language) 是 二 进 制 序 列 ( 即 0 和 1 的 序列 )，CPU 根据 它 的 指令 集 
操作 码 进 行 解读 。 机 器 语言 代码 会 在 内 存 地 址 后 面 用 十 六 进 制 表 示 这 两 条 指令 ， 如 下 所 示 : 

01A3 FD034E 

01A6 0C 

如 果 只 有 指令 的 十 六 进 制 表示 ， 那 么 必须 把 它 转换 为 二 进 制 ， 检 查 指 令 指 示 符 字 段 的 内 
容 来 确定 这 条 指令 是 做 什么 的 。 


4.2 直接 寻 址 


本 节 讲 解 ISA3 层 上 某 些 Pep/9 指令 的 操作 ， 包 括 这 些 指令 如 何以 直接 寻 址 方式 进行 操 
作 。 后 面 的 章节 将 讲述 其 他 寻 址 方式 。 

寻 址 字段 决定 了 CPU 怎样 解读 操作 数 指示 符 。aaa 寻 址 字段 001 表示 直接 寻 址 。 如 果 
采用 直接 寻 址 ，CPU 会 把 操作 数 指示 符 解 释 为 包含 操作 数 的 主 存 单元 地 址 。 用 数学 符号 表 
示 是 

Oprnd = Mem[OprndSpec] 

这 里 Oprnd 表示 操作 数 ，OprndSpec 表示 操作 数 指示 符 ，Mem 表示 主 存 。 

方 括号 表示 你 可 以 把 主 存 想象 成 一 个 数组 ， 把 操作 数 指示 符 想 象 成 数组 的 索引 。 在 C 
语言 中 ， 如 果 v 是 数组 ，i 是 整数 ， 则 vi] 是 由 整数 i 的 值 所 确定 的 数组 中 的 “单元 ” 。 类 似 
地 ， 指 令 中 的 操作 数 指示 符 标 识 主 存 中 包含 操作 数 的 单元 。 

接 下 来 要 说 明 的 是 某 些 Pep/9 指令 集 的 指令 ， 每 条 指令 的 描述 都 会 列 出 操作 码 ， 并 举 一 
个 使 用 直接 寻 址 的 指令 操作 的 例子 N Z, VAC 的 值 都 以 二 进 制 的 形式 给 出 ， 其 他 寄存 
器 和 内 存单 元 的 值 是 用 十 六 进 制 表示 的 。 在 机 器 层 ， 所 有 的 值 最 终 都 是 二 进 制 的 。 在 讲述 完 
每 条 指令 之 后 ， 本 章 结尾 会 展示 怎样 用 它们 一 起 组 成 机 器 语言 程序 。 


4.2.1 停止 指令 


停止 指令 的 指令 指示 符 是 0000 0000。 执 行 这 条 指令 就 是 简单 地 让 计算 机 停 下 来 。Pep/9 
是 一 台 模拟 的 计算 机 ， 通 过 运行 计算 机 上 的 Pep/9 模拟 器 来 执行 它 。 模 拟 器 有 命令 选项 菜单 
供 你 选择 ， 选 项 之 一 就 是 执行 Pep/9 程序 。 当 Pep/9 程序 执行 时 遇 到 这 条 指令 时 ， 就 会 停止 
并 把 模拟 器 返回 到 命令 选项 菜单 。 停 止 执 行 指令 是 一 元 指令 ， 它 没有 操作 数 指示 符 。 


4.2.2 FARES 
装 人 指令 的 指令 指示 符 是 1100 raaa， 它 根据 r 的 值 ， 把 1 个 字 (2 字 节 ) 从 内 存单 元 装 
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入 累加 器 或 者 变 址 寄存 器 。 它 影响 N 位 和 Z 位 。 如 果 操 作 数 是 负数 ， 就 把 NN 位置 为 1 ; T 
则 ,把 NN 位 置 为 0。 如 果 操 作 数 是 16 位 0， 就 把 Z 位 置 为 1; 和 否则, 把 Z 位置 为 0。 装 和 人 指 
令 的 寄存 需 传 送 语言 (RTL) 描述 是 

r+— Oprnd; Nr<0,2Z r=0 

GEE) 假定 要 执行 指令 的 十 六 进 制 表示 是 C1004A， 图 4-10 给 出 了 二 进 制 表示 。 本 例 
中 寄存 器 fr 字段 是 0， 表示 装 人 累加 器 而 不 是 变 址 寄存 器 。aaa 寻 址 字段 是 001， 表 示 是 直接 
ik. 

指令 指示 符 操作 数 指示 符 


Opcode r aaa 


CT 


C 1 0 0 4 A 
图 4-10 字 装 入 指令 


假定 Mem[004A] 的 初始 内 容 是 92EF， 图 4-11 展示 了 执行 装 入 指令 后 的 结果 。 装 人 指 
令 不 会 改变 内 存单 元 的 内 容 ， 它 把 两 个 内 存单 元 (地址 004A 和 004B) 内 容 的 副本 发 送 到 寄 
存 器 。 无 论 指 令 执行 前 寄存 器 中 是 什么 ,在 本 例 中 是 036D， 它 都 会 被 覆盖 。 由 于 被 装 入 的 
位 模式 的 符号 位 是 1， 所 以 N 位 被 置 为 1。 该 位 模式 不 是 全 0， 因 此 Z 位 被 置 为 0。 装 入 指 
令 对 V A C 位 没有 影响 。 


CPU Mem 


NZ C] C1004A 
A QA 装 入 累加 器 





Meee 
a) 执行 前 b ) 执行 后 
图 4-11 字 装 人 指令 的 执行 
图 4-11 展示 了 装 入 指令 的 数据 流 和 控制 流 。 如 实 线 所 示 ， 数 据 流 从 总 线 上 的 主 存 到 
CPU， 然 后 再 到 寄存 器 。 为 了 进行 此 次 数据 传送 ，CPU 必须 向 主 存 发 送 控制 信号 ， 如 虚线 
所 示 ， 让 它 把 数据 放 到 总 线 上 。CPU 也 会 告知 主 存 到 哪个 地 址 取 数 据 。 m 


4.2.3” 字 存储 指令 


字 存 储 指令 的 指令 指示 符 是 1110 raaa， 它 把 1 个 字 (2 字 节 ) 从 累加 器 或 者 变 址 寄存 器 
存储 到 内 存单 元 。 对 于 直接 寻 址 ， 操 作 数 指定 信息 存储 的 内 存单 元 。 存 储 指令 的 RTL 描述 是 
Oprnd & r 
假定 要 执行 指令 的 十 六 进 制 表示 是 E9004A， 图 4-12 是 它 的 二 进 制 表示 。 这 
次 ， 寄存器 r+ 字段 标明 指令 将 作用 于 变 址 寄存 器 ， 寻 址 aaa 字段 001 表示 直接 寻 址 。 
指令 指示 符 操作 数 指示 符 


Opcode r aaa 


Tit ope o pooo oo] oo 
E 9 


0 0 4 A 
图 4-12” 字 存储 指令 


195 
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假定 变 址 寄存 器 的 初始 内 容 是 16BC， 图 4-13 展示 了 执行 存储 指令 后 的 结果 。 存 储 指 令 
不 会 改变 寄存 器 的 内 容 ， 它 把 寄存 器 内 容 的 副本 发 送 到 两 个 内 存单 元 (地址 004A 和 004B ) 。 
无 论 指令 执行 前 内 存单 元 中 是 什么 ， 在 本 例 中 是 F082， 它 都 会 被 覆盖 。 存 储 指 令 不 影响 任 
何 状态 位 。 a 


CPU Mem 
x [aa eo004A 
004A 存储 变 址 寄存 器 


a) 执行 前 





图 4-13 字 存 储 指令 的 执行 


4.2.4 加 法 指令 


加 法 指令 的 指令 指示 符 是 0111 raaa。 类 似 于 装 人 指令 ， 加 法 指令 中 数据 也 从 主 存 传送 
到 CPU 的 寄存 器 r 中 。 但 是 ， 对 于 加 法 指令 ， 寄 存 器 的 初始 内 容 不 是 简单 地 被 来 自主 存 的 
字 内 容 改写 ， 而 是 把 这 个 字 的 内 容 和 寄存 器 的 内 容 相 加 ， 再 把 和 放 在 这 个 寄存 器 中 ， 并 相应 
地 设置 4 个 状态 位 。 与 字 装 人 指令 一 样 的 是 内 存 字 的 内 容 被 复制 到 CPU， 而 它 的 原始 内 容 
不 会 改变 。 加 法 指令 的 RTL 描述 是 

r+—r+Oprmd; N«r<0,Z+r=0, V< {ÑH }, C { IZ} 

假定 要 执行 指令 的 十 六 进 制 表示 是 69004A， 图 4-14 是 它 的 二 进 制 表示 。 寄 存 
器 r 字 有 段 表示 指令 将 作用 于 变 址 寄存 器 ， 寻 址 aaa 字段 001 表示 直接 寻 址 。 

指令 指示 符 操作 数 指示 符 


Opcode r aaa 


om oo oor oo or 


6 9 0 0 4 A 
图 4-14 加 法 指令 


假定 变 址 寄存 器 的 初始 内 容 是 0005，Mem[004A] 是 -7 (dec) =FFF9 (hex), 图 4-15 
展示 了 执行 加 法 指令 后 的 结果 。 在 十 进 制 中 ,5 + (-7) 是 -2， 在 图 4-15b 中 显示 为 FFFE 
(hex)。 图 中 NZVC 位 以 二 进 制 显示 ， 因 为 和 是 负数 ， 所 以 N 位 是 1。 由 于 和 不 为 全 0， 所 


以 Z 位 是 0。 没 有 溢出 ， 因 此 V 位 是 0。 最 高 位 没有 进位 ， 因 此 C 位 是 0。 s 
CPU Mem 
nzvc[ | FFF9 
Š 004A 





a) 执行 前 b) 执行 后 
图 4-15 加 法 指令 的 执行 


4.2.5 ”减法 指令 
减法 指令 的 指令 指示 符 是 0111 raaa， 除 了 是 把 寄存 器 内 容 减 去 操作 数 外 ， 它 类 似 于 加 
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法 指令 。 结 果 放 在 寄存 器 中 ， 操 作 数 不 会 被 改变 。 对 于 减法 ，C 位 表示 加 上 操作 数 的 负数 之 
后 的 进位 。 减 法 指令 的 RTL 描述 是 
r«—r-Oprnd; N+-r<0,Z+-r=0, V+ { fet }, C { HELE } 
假定 要 执行 指令 的 十 六 进 制 表示 是 71004A， 图 4-16 是 它 的 二 进 制 表示 。 寄 存 
器 了 字段 表示 指令 将 作用 于 累加 器 。 
指令 指示 符 操作 数 指示 符 


Opcode r aaa 


or ro oo ro or or 


7 1 0 0 4 A 
图 4-16 减法 指令 


假定 累加 器 的 初始 内 容 是 0003，Mem[004A] 是 0009, 图 4-17 显示 了 执行 减法 指令 后 
的 结果 。 在 十 进 制 中 ，3 减 去 9 的 差 是 -6， 在 图 4-17b 中 用 十 六 进 制 表示 为 FFFA (hex). 
图 中 NZVC 位 以 二 进 制 显示 ， 因 为 和 是 负数 ， 所 以 N 位 是 1。 由 于 和 不 是 全 0， 所 以 Z 位 是 





0。 没 有 洲 出 ， 因 此 V 位 是 0。3 加 -9 时 没有 进位 ， 因 此 C 位 是 0。 a 
CPU Mem 
navel] nova 
a D084 累加 器 减 去 
a) 执行 前 b) 执行 后 


图 4-17 加 法 指令 的 执行 


4.26 与 和 或 指令 


与 (AND) 指令 的 指令 指示 符 是 1000 raaa, BK (OR) 指令 的 指令 指示 符 是 1001 raaa, 
两 条 指令 都 类 似 于 加 法 指令 。 这 些 指 令 对 寄存 器 执行 逻辑 运算 ， 而 不 是 把 操作 数 加 到 寄存 器 
H, AND 运算 可 以 帮助 掩 去 位 模式 中 不 希望 其 值 为 1 的 位 ，OR 运算 用 于 在 位 模式 中 往 某 些 
位 上 插入 1。 这 两 条 指令 对 N 和 了 Z 位 都 有 影响 ， 但 不 会 改变 V AIC 位 。 与 和 或 指令 的 RTL 
描述 是 

rr À Oprnd; Nor<0,Z r=0 

r+-r V Oprnd; N#-r<0,Z+-r=0 

假定 要 执行 指令 的 十 六 进 制 表示 是 89004A， 图 4-18 是 它 的 二 进 制 表示 。 操 作 
码 表示 要 执行 与 指令 ， 寄 存 器 r 字 段 表示 指令 将 作用 于 变 址 寄存 器 。 


指令 指示 符 操作 数 指示 符 
Opcode r aaa 


oo opoo) CT 


8 9 0 0 4 A 
图 4-18 与 指令 


假定 变 址 寄存 器 的 初始 内 容 是 5DC3，Mem[004A] Æ 00FF, K 4-19 展示 了 执行 与 指令 
后 的 结果 。 在 二 进 制 中 ，00FF 是 0000 0000 1111 1111, Mem[004A] 每 个 值 为 1 的 位 所 对 应 
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的 变 址 寄存 器 的 位 不 改变 ， 每 个 值 为 0 的 位 所 对 应 的 寄存 器 位 被 置 为 0。 图 中 以 二 进 制 展 示 
NZ 位 ， 因 为 变 址 寄存 器 中 被 看 作 有 符号 整数 的 数值 不 为 负 ， 所 以 N 位 是 0。 变 址 寄存 器 不 





全 为 0， 因 此 Z 位 是 0。 2 
CPU Mem 
Nz[ |] 89004A 
x 004A | 与 变 址 寄存 器 
a) 执行 前 b) 执行 后 


图 4-19 与 指令 的 执行 
图 4-20 展示 了 或 指令 的 运算 ,除了 指令 指示 符 的 操作 码 99 是 1001 外 (表示 它 


是 或 指令 )， 初 始 状态 和 例 4.8 一样 。 这 次 ，Mem[004A] 每 个 值 为 0 的 位 所 对 应 的 变 址 寄存 


器 的 位 不 会 改变 ， 每 个 值 为 1 的 位 所 对 应 的 寄存 器 的 位 被 置 为 1。 如 果 把 变 址 寄存 器 当 作 有 





符号 整数 ， 其 值 不 为 负 ， 因 此 N 位 是 0。 m 
CPU Mem 
nz[__] 99004A 
x 004A | 或 变 址 寄存 器 
a) 执行 前 b ) 执行 后 


图 4-20 与 指令 的 执行 


4.2.7” 按 位 取 反 和 取 负 指令 


按 位 取 反 指令 的 指令 操作 符 是 0000 011r， 取 负 指 令 的 指令 操作 符 是 0000 100r。 两 条 指 
令 都 是 一 元 的 ， 它 们 没有 操作 数 指示 符 。 按 位 取 反 指令 对 寄存 器 执行 NOT 运算 ， 即 每 位 1 
变 为 0, 0 变 为 1。 它 影响 N 和 2Z 位 。 按 位 取 反 指令 的 RTL 描述 是 

有 

取 负 指令 把 寄存 器 当 作 有 符号 整数 并 对 它 取 负 。16 位 寄存 器 存储 有 符号 整数 的 范围 
是 -32 768 到 32 767。 取 负 指 令 影 响 N、Z 和 V 位 ， 因 为 没有 对 应 的 正 值 32 768， 所 以 当 
寄存 器 原始 值 是 -32 768 时 ，V 位 置 为 1。 取 负 指 令 的 RTL 描述 是 

r—— rr N—r<0,2+f=0, V— {eh} 

假定 要 执行 指令 的 十 六 进 制 表示 是 06， 图 4-21 是 


它 的 二 进 制 表示 。 操 作 码 表示 要 执行 按 位 取 反 指令 ， 寄存器 r 字 ili 
段 表示 指令 将 作用 于 累加 器 。 
假定 累加 器 的 初始 内 容 是 0003 (hex), BI 0000 0000 0000 0 6 


0011 (bin), K| 4-22 展示 了 执行 取 反 指令 的 结果 。NOT 运算 将 位 


图 4-21 按 位 取 反 指令 
模式 变 为 1111 1111 1111 1100， 如 果 把 它 看 作 有 符号 整数 ， 因 为 
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累加 器 的 数值 为 负 ， 所 以 N 位 为 1!。 因 为 累加 器 不 为 全 0， 所 以 Z 位 为 0。 m 

图 4-23 展示 了 取 负 指令 的 运算 ， 除 了 指令 指示 符 的 操作 码 1A 为 0001 101 外 
(表示 它 是 取 负 指令 )， 初 始 状态 和 例 4.10 一 样 。3 取 负 是 -3， 即 1111 1111 1111 1101 (bin)= 
FFFD (hex). al 


CPU 





Nz[ | 06 Nz[ | 08 Nz [i 
r 累加 器 按 位 取 反 办 加 器 取 负 ”| 和 RRB 
a) 执行 前 b) 执行 后 a) 执行 前 b ) 执行 后 
图 4-22 按 位 取 反 指令 的 执行 图 4-23” 取 负 指 令 的 执行 201 


4.28 字 节 装 入 和 字 节 存储 指令 

这 两 条 指令 和 接 下 来 的 两 条 都 是 字 节 指 令 ， 字 节 指 令 是 对 单个 字 节 而 不 是 一 个 字 进 行 操 
作 。 字 节 装 人 指令 的 指令 操作 符 是 1101 raaa， 字 节 存 储 指 令 的 指令 操作 符 是 1111 raaa。 装 
入 字 节 指令 把 操作 数 装 人 累加 器 或 变 址 寄存 器 的 右 半 部 分 ， 影 响 N AZ 位 ， 保 持 寄存 器 左 
半 部 分 不 变 。 字 节 存 储 指令 把 累加 器 或 者 变 址 寄存 器 的 右 半 部 分 存储 到 一 个 单字 节 内 存单 
元 ， 不 影响 任何 状态 位 。 字 节 装 人 指令 的 RTL 描述 是 

r <8..15> — byte Oprnd; N < 0, Z — r <8..15> = 0 
字 节 存储 指令 的 RTL 描述 是 

byte Operand + r <8..15> 

假定 要 执行 指令 的 十 六 进 制 表示 是 D1004A， 图 4-24 是 它 的 二 进 制 表示 。 本 
例 中 寄存 器 r 字 段 是 0， 表 示 装 入 累加 器 而 不 是 变 址 寄存 器 。 寻 址 aaa 字段 是 001， 表 示 是 
直接 寻 址 。 


指令 gal 操作 数 指示 符 
TPT r 


图 4-24 字 节 装 人 指令 


假定 Mem[004A] 的 初始 内 容 是 92， 图 4-25 展示 了 执行 字 节 装 人 指令 后 的 结果 。 该 指 
令 的 NN 位 总 是 设置 为 0。 由 于 装 入 累加 器 右 半 部 分 的 8 位 不 全 为 0，Z 位 也 设置 为 0。 m 


CPU Mem 
NMzL | D1004A 
A 004A | 字 节 装 入 累加 器 


a) 执行 前 b) 执行 后 
图 4-25 字 节 装 人 指令 的 执行 
图 4-26 展示 了 执行 字 节 存储 指令 后 的 结果 。 除 了 指令 是 字 节 存储 而 不 是 字 节 
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装 入 外 ， 初 始 状态 和 例 4.12 一 样 。 累 加 器 的 右 半 部 分 为 6D， 传 送 到 地 址 004A 的 内 存单 元 。 
Mem 


a 
CPU CPU Mem 
004A 累加 器 存储 字 节 004A 
H A 


a) 执行 前 b) 执行 后 
图 4-26 字 节 存储 指令 的 执行 





4.2.9 输入 和 输出 设备 


输入 设备 的 地 址 是 FC15， 它 与 ASCI 字符 输入 设备 相连 ， 比 如 键盘 。 通 过 在 地 址 
FC15 执行 字 节 装 入 指令 从 输入 设备 获取 一 个 字符 。 输 出 设备 的 地 址 是 FC16， 它 与 ASCII 
字符 输出 设备 相连 ， 比 如 屏幕 。 通 过 在 地 址 FC16 执行 字 节 存储 指令 向 输出 设备 发 送 一 个 
字符 。 

假设 要 执行 指令 的 十 六 进 制 表示 为 DIFC15， 其 含义 是 用 直接 寻 址 对 输入 设备 
执行 字 节 装 和 指令。 假定 输入 流 中 的 下 一 个 字符 为 W， 图 4-27 展示 了 执行 该 条 指令 的 结果 。 
输入 流 中 的 字符 可 以 来 自 于 键盘 ， 也 可 以 来 自 于 文件 。 如 图 所 示 ， 键盘 连接 到 地 址 为 FC15 
的 内 存 位 置 。 用 户 按 下 Wi, 字母 W ÉY ASCI I 57 (hex) 被 发 送 给 累加 器 。 


CPU vem 键盘 CPU 

S7 Q@® DIFC15 
OOS) ee 
eee 


a) 执行 前 b) 执行 后 


图 4-27 从 输入 设备 装 人 字 节 的 指令 








从 CPU 到 主 存 的 虚线 表示 控制 信号 ， 它 指示 内 存 子 系统 把 从 地 址 FC15 取出 的 字 节 
放 到 系统 总 线 上 。 内 存 子 系统 有 专用 输入 电路 ， 用 于 检测 来 自 地 址 FC15 的 内 存 装 入 请 
求 。 然 后 执行 全 部 必要 的 步骤 ， 把 输入 流 中 的 下 一 个 字符 送 入 Mem[FC15]， 再 放 到 系统 总 
线 上 。 这 是 计算 机 系统 中 抽象 层次 的 一 个 例子 。 对 ISA3 层 程 序 员 来 说 ， 字 符 从 键盘 传输 
到 Mem[FC15] 的 细节 被 隐藏 起 来 ， 这 一 层 的 程序 员 只 需要 知道 ， 要 想 从 输入 流 获 取 下 一 个 
ASCII 字符 ， 就 从 地 址 Mem[FC15] 装 人 一 个 字 节 。 国 

假设 要 执行 指令 的 十 六 进 制 表示 为 FIFC16， 其 含义 是 用 直接 寻 址 对 输出 设 
备 执行 字 节 存储 指令 。 假 定 累 加 器 右 半 部 分 中 的 内 容 为 69 (hex), BBE i HY ASCI (B, 
图 4-28 展示 了 执行 该 条 指令 的 结果 。 如 图 所 示 ， 屏 幕 连接 到 地 址 为 FC16 的 内 存 位 置 。 字 母 
i 的 ASCII 值 被 送 入 Mem[FC16]。 和 输入 设备 一 样 ， 内 存 子 系统 有 专用 电路 检测 一 个 字 节 什 
么 时 候 被 存储 到 Mem[FC16]， 并 将 其 送 入 输出 流 显示 到 屏幕 上 。 a 
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Mem 屏幕 
CPU 
H F1FC16 
A 累加 器 存储 字 节 
[| 
a ) 执行 前 b) 执行 后 


图 4-28 ”向 输出 设备 存储 字 节 的 指令 


4.2.10 ”大 端 顺序 和 小 端 顺序 


关于 信息 在 CPU 寄存 器 与 主 存 字 节 之 间 的 传输 有 两 种 CPU 设计 理念 。 出 现 这 个 问题 的 
原因 在 于 主 存 总 是 按 字 节 寻 址 ， 而 CPU 中 的 寄存 器 一 般 包 含 多 个 字 节 。 设 计 问 题 是 : 字 节 
序列 按照 什么 顺序 存储 在 主 存 中 ?选择 有 两 个 。CPU 可 以 把 最 高 有 效 字 节 存 放 在 最 小 地 址 ， 
这 称 为 大 端 序 (big-endian order); 或 者 也 可 以 把 最 低 有 效 字 节 存 放 在 最 小 地 址 ， 这 称 为 小 端 
序 (little-endian order)。 只 要 指令 集中 所 有 指令 使 用 的 是 相同 的 顺序 ， 那 么 选择 这 两 种 中 的 
任何 一 个 都 可 以 。 

计算 机 行业 中 没有 占 主 导 地 位 的 标准 ， 有 些 处 理 器 用 大 端 序 ， 有 些 用 小 端 序 ， 还 有 的 可 
以 根据 底层 软件 的 设置 在 两 种 顺序 之 间 切 换 。Pep/9 是 大 端 序 CPU。 图 4-13 展示 了 存储 指令 
的 执行 结果 。 寄 存 器 中 的 最 高 有 效 字 节 是 16， 存 放 在 最 低地 址 004A 上 。 寄 存 器 中 的 下 一 个 
字 节 是 BC， 存 放 在 高 地 址 004B 上 。 图 4.11 展示 的 装 人 指令 与 存储 指令 是 一 致 的 。 寄 存 器 中 
的 最 高 有 效 字 节 是 92， 该 值 来 自 低 字 节 地 址 004A， 下 一 个 字 节 的 EF 来 自 高 字 节 地 址 004B。 

与 之 不 同 ， 图 4-29 展示 了 装 人 指令 在 小 端 序 CPU 上 的 执行 情况 。 低 地 址 004A 上 的 字 节 
值 为 92， 装 人 了 寄存 器 的 最 低 有 效 字 节 。 而 来 自 下 一 个 较 高 地 址 004B 的 字 节 值 则 在 寄存 器 
中 装 入 了 该 低位 字 节 的 左边 。 图 4-30 显示 了 大 端 序 和 小 端 序 CPU 中 ， 装 入 指令 在 32 位 寄存 
器 上 的 执行 结果 。32 位 寄存 器 包含 4 个 字 节 ， 根 据 CPU 是 大 端 序 还 是 小 端 序 分 别 按照 从 最 高 
有 效 字 节 到 最 低 有 效 字 节 的 顺序 ， 或 者 是 从 最 低 有 效 字 节 到 最 高 有 效 字 节 的 顺序 装 入 累加 器 。 


CPU Mem 


nz[_] 小 端 序 CPU 
A 004A 累加 器 装 人 








L | 


a) 执行 前 b ) 执行 后 
图 4-29 ”小 端 序 CPU 中 的 装 人 指令 





Mem[019E] 89 89 89 


Mem[019F] AB AB AB 
Mem[01A0] CD CD CD 
Mem[01A1] EF EF EF 

累加 器 89 AB CD EF EF CD AB 89 


图 4-30 使 用 32 位 寄存 器 的 装 入 指令 





205 








206 
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“ 端 ” 这 个 字 来 自 乔 纳 森 ' 斯 威夫 特 1726 年 的 小 说 《 格 列 佛 游记 》 两 个 有 争端 的 王国 ， 
小 人 国 (Lilliput) 和 大 人 国 (Blefuscu)， 有 着 不 同 的 打破 鸡蛋 的 习俗 。 小 人 国 的 习惯 是 从 小 
头 打 破 鸡 蛋 ， 因 此 被 称 为 小 端 ， 而 大 人 国 的 习惯 是 从 大 头 打 破 鸡蛋 ， 因 此 被 称 为 大 端 。 这 部 
小 说 是 一 种 夸张 地 演绎 ， 反 映 了 无 意义 战争 的 荒唐 。 但 这 个 术语 是 合适 的 ， 因 为 无 论 CPU 
是 大 端 还 是 小 端 都 是 无 关 紧要 的 。 


4.3 冯 “' 诺 依 曼 机 器 


在 最 早期 的 电子 计算 机 中 ， 每 个 程序 都 是 手工 接线 的 。 要 改变 程序 ， 线 路 必须 要 手工 重 
连 ， 这 是 单调 又 耗 时 的 过 程 。3.1 节 中 描述 的 电子 数值 积分 计算 机 (ENIAC) 就 是 这 种 计算 
机 ， 它 的 内 存 仅仅 用 来 存储 数据 。 

1945 年 ， 约 翰 ' 冯 ' 诺 依 曼 在 宾夕法尼亚 大 学 的 一 份 报告 中 提议 美国 军械 部 建造 一 台 
在 主 存 中 可 以 存储 数据 也 可 以 存储 程序 的 计算 机 。 那 时 ， 存 储 程序 是 一 个 相当 激进 的 理念 。 
1949 年 ，Maurice V. Wilkes 在 剑桥 大 学 建造 了 电子 延迟 存储 自动 计算 器 (EDSAC)， 这 是 用 
B 诺 依 曼 的 存储 程序 理念 建造 的 第 一 台 计 算 机 。 实 际 上 , 今天 所 有 的 商用 计算 机 都 是 基于 
存储 程序 概念 ， 程 序 和 数据 共享 主 存 。 尽 管 有 人 认为 J. Presper Eckert 7273 + 诺 依 曼 的 论文 
发 表 的 前 几 年 就 提出 这 个 概念 ， 但 是 这 种 计算 机 还 是 被 称 作 冯 ， 诺 依 曼 计 算 机 。 


4.3.1 ” 冯 : 诺 依 曼 执 行 周期 
Pep/9 计算 机 是 一 个 典型 的 冯 诺 依 曼 计算 机 。 Load the machine language program 





图 4-31 是 执行 一 个 程序 所 需 步骤 的 伪 代码 描述 。 a 
这 个 do 循环 称 作 + GEAR 受 执行 周 期 ， 二 个 并 Fetch the next instruction 

期 包括 5 个 操作 : Decode the instruction specifier 

Increment PC 

e 从 MEM[PC] 中 取 指 Execute the instruction fetched 
i 译 码 被 取 指令 uk (the stop instruction di t te) 
è 增 加 PC while (the stop instruction does not execute 
e 执行 被 取 指 令 图 4-31 在 Pep/9 计算 机 上 执行 一 个 程 
e 重复 序 所 需 步 又 的 伪 代 码 描述 
+ 诺 依 曼 周 期 固化 在 CPU 中 ， 下面 是 执行 过 

程 中 详细 步骤 的 描述 。 


为 了 把 机 器 语言 程 序 装 入 主 存 ， 第 一 条 指令 要 放 在 地 址 0000 (hex). 第 二 条 指令 放 在 
与 第 一 条 相 邻 的 地 址 。 如 果 第 一 条 指令 是 一 元 的 ， 那 么 第 二 条 指令 的 地 址 是 0001 ; 否则 
第 一 条 指令 的 操作 数 指示 符 会 放 在 地 址 0001 和 0002 的 字 节 ,那么 第 二 条 指令 的 地 址 将 是 
0003。 类 似 地 ， 第 三 条 指令 放 在 与 第 二 条 相 邻 的 地 址 ， 整 个 机 器 语言 程序 就 是 这 样 装载 到 内 
存 的 。 

为 了 初始 化 程序 计数 器 和 栈 指针 ，PC 置 为 0000 (hex), SP 置 为 Mem[FFF4]。 程 序 计数 
器 的 目的 是 保存 下 一 条 要 执行 指令 的 地 址 。 因 为 第 一 条 指令 装 入 主 存 的 地 址 是 0000， 所 以 
PC 必须 要 初始 化 为 0000。 栈 指针 的 目的 是 保存 运行 时 栈 顶 部 的 地 址 。 后 面 将 解释 SP 为 何 
设置 为 Mem[FFF4]。 

Yh + 诺 依 曼 执行 周期 的 第 一 个 操作 是 取 指 令 。 要 获取 一 条 指令 ，CPU 检测 PC 中 的 16 
位 ， 把 它 当 作 一 个 地 址 到 主 存 的 这 个 地 址 获取 下 一 条 指令 的 指令 指示 符 (1 字 节 )。 把 指 
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令 指 示 符 的 8 位 装 入 CPU， 放 到 指令 寄存 器 CIR) 的 第 一 个 字 节 。 

1 + 诺 依 曼 执行 周期 的 第 二 个 操作 是 译 码 。CPU 从 指令 指示 符 中 提取 操作 码 ， 确 定 要 
执行 哪 条 指令 。 根 据 操作 码 ， 如 果 有 的 话 ， 就 提取 寄存 器 指示 符 和 寻 址 字段 。CPU 根据 操 
作 码 就 能 知道 指令 是 不 是 一 元 的 ， 如 果 不 是 一 元 指令 ， 那么 就 从 内 存 获取 操作 数 指示 符 (一 
个 字 )， 把 它 存 储 在 IR 的 最 后 两 个 字 节 。 

7 + 诺 依 曼 执行 周期 的 第 三 个 操作 是 增加 PC。 如 果 指令 是 一 元 指令 ，CPU 对 PC 加 1， 
否则 加 0003。 不 管 PC 加 哪个 数 ， 相 加 后 的 值 都 是 下 一 条 指令 的 地 址 ， 因 为 在 主 存 中 指令 是 
相 邻 的 。 

冯 “' 诺 依 曼 执行 周期 的 第 四 个 操作 是 执行 。CPU 执行 存储 在 IR 中 的 指令 ， 操 作 码 告诉 
CPU 执行 40 条 指令 中 的 哪 一 条 。 

+ 诺 依 曼 执 行 周期 的 第 五 个 操作 是 重复 。 除 非 刚刚 执行 的 指令 是 停止 指令 ， 和 否则 
CPU 返回 到 取 指 令 操作 。 如 果 指 令 试 图 执行 一 个 非法 操作 ，Pep/9 也 将 在 此 时 终止 。 有 些 指 
令 不 允许 使 用 特定 的 寻 址 方式 。 使 Pep/9 终止 的 最 常见 的 非法 操作 是 试图 以 禁止 的 寻 址 方式 
执行 指令 。 

图 4-32 是 在 Pep/9 计算 机 上 执行 一 个 程序 所 需 步 又 的 详细 伪 代 码 描述 。 

Load the machine language program into memory starting at address 0000. 
PC — 0000 
SP<— Mem[FFF4] 
do { 
Fetch the instruction specifier at address er in PC 


PC+PC+I1 
Decode the instruction specifier 


if (the instruction is not unary) { 
Fetch the operand specifier at address in PC 
PC — PC +2 
! 
Execute the instruction fetched 
} 


while ((the stop instruction does not execute) && (the instruction is legal)) 





图 4-32 在 Pep/9 计 算 机 上 执行 一 个 程序 所 需 步骤 的 详细 伪 代 码 描述 


4.3.2 一 个 字符 输出 程序 


Pep/9 系统 可 以 从 键盘 输入 ， 再 输出 到 屏幕 。 这 些 IO 设备 都 是 基于 ASCI 字 符 集 
的 。 当 你 按 下 一 个 键 ， 代 表 一 个 ASCII 字 符 的 一 字 节 信息 从 键盘 输入 后 ， 被 添加 到 位 于 
Mem[FC15] 的 输入 设备 的 输入 流 中 。 当 CPU 向 位 于 Mem[FC16] 的 输出 设备 发 送 一 个 字 节 
时 ， 屏 幕 把 这 个 字 节 解释 为 一 个 ASCII 字符 ， 并 显示 它 。 

在 ISA3 层 ， 机 器 层 ， 计 算 机 通常 只 有 字 节 类 型 的 输入 和 输出 指令 。 对 字 节 的 解释 发 生 
在 输入 和 输出 设备 ， 而 不 在 主 存 中 。Pep/9 唯一 的 输入 指令 是 字 节 装 入 ， 即 把 一 个 字 节 从 输 
入 设备 装 入 到 CPU 中 的 一 个 寄存 器 ; 唯一 的 输出 指令 是 字 节 存储 ， 即 把 一 个 字 节 从 CPU 
的 寄存 器 传送 到 输出 设备 。 因 为 通常 会 把 这 些 字 节 解释 成 ASCI 字符 ， 所 以 Pep/9 系统 在 
ISA3 层 的 IO 称 作 字符 IO。 

图 4-33 展示 了 一 个 简单 的 机 器 语言 程序 ， 它 在 输出 设备 上 输出 字符 Hi。 它 使 用 了 三 条 
指令 : 指令 1101 raaa 从 主 存 地 址 装 入 一 个 字 节 ; 指令 1111 raaa 向 输出 设备 存 人 一 个 字 节 ; 
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以 及 停止 指令 0000 0000。 第 一 段 代码 展示 的 是 二 进 制 机 器 语言 程序 ， 主 存 存储 这 些 1 和 0 
的 序列 。 第 一 列 是 每 行 上 位 模式 第 一 个 字 节 的 十 六 进 制 地 址 。 

第 二 段 代码 展示 了 同一 个 程序 的 十 六 进 制 简写 。 尽 管 这 个 格式 稍微 易 读 一 点 儿 ， 但 是 你 
要 并 记 内 存 存储 的 是 位 ， 





而 不 是 代码 中 那样 的 字面 机 器 语言 (bin ) 
上 的 十 六 进 制 字符 。 第 二 1101 0001 0000 0000 
段 代 码 的 每 行 都 有 注释 ， 1111 0001 1111 1100 
Wee e 1101 0001 0000 0000 
用 分 号 与 机 器 语言 隔 开 。 1111 0001 1111 1100 
注释 不 会 随 程序 装 和 内存。 0000 0000 
图 4-34 展 示 了 计算 0100 1000 0110 1001 
机 执行 这 个 程序 前 三 条 指 机 器 语言 (hex ) 
令 的 每 一 步 。 图 4-34a 是 D1000D ;Load byte accumulator 'H' 
Pep/9 计算 机 的 初始 状态 ， F1FC16 ;Store byte accumulator output device 
x D1000E ;Load byte accumulator 'i' 
图 中 没有 磁盘 或 输入 设备 ， FIEFC16 ;Store byte accumulator output device 
该 程序 没有 用 到 的 几 个 ;Stop 
CPU 寄存 器 也 被 省 略 了 。 ;ASCII "Hi" characters 
初始 时 ， 主 存单 元 和 CPU 
寄存 器 的 内 容 是 未 知 的 。 
图 4-34b 是 过 程 的 第 
一 步 。 程 序 装 人 主 存 , 起 图 4-33 输出 字符 Hi 的 机 器 语言 程序 


始 地 址 是 0000。 程 序 来 自 
哪里 和 什么 把 它 放 入 的 内 存 ， 这 些 细 节 将 在 后 面 的 章节 描述 。 

4-34c 是 过 程 的 第 二 步 。 程 序 计数 器 清空 置 为 0000 ( hex)， 图 中 没有 显示 对 SP 的 初 
始 化 ， 因 为 这 个 程序 不 会 用 到 栈 指针 。 

图 4-34d 是 执行 周期 的 取 指 令 部 分 。CPU 检测 到 PC 中 的 位 为 0000 (hex), RECRE 
存 发 信和 号 让 主 存 把 这 个 地 址 的 字 节 发 送 到 CPU。 当 CPU 获得 这 个 字 节 时 ， 把 它 填 人 指令 寄 
存 器 的 第 一 部 分 。 接 着 CPU 对 指令 指示 符 解码 ， 根 据 操作 码 确定 指令 不 是 一 元 指令 ， 于 是 
把 操作 数 指示 符 也 读 入 IR。 取 指令 不 会 改变 地 址 0000、0001 和 0002 的 内 容 ， 主 存 只 是 把 
这 24 位 的 内 容 复制 到 CPU。 

图 4-34e 显示 执行 周期 的 增加 部 分 ，CPU 给 PC 加 上 0003. 

图 4-34f 显示 执行 周期 的 执行 部 分 ，CPU 检测 到 IR 的 前 4 位 为 1101， 此 操作 码 给 电路 
发 信号 ， 执 行 字 节 装 人 指令 。CPU 检测 r 字 段 ， 发 现 其 值 为 0， 表示 是 累加 器 ; 检测 aaa 寻 
址 字段 ， 发 现 其 值 为 001， 表 示 是 直接 寻 址 。 接 着 CPU 检测 操作 数 指示 符 ， 其 内 容 为 000D 
(hex)， 于 是 给 主 存 发 送 控制 信号 ， 直 接 走 到 地 址 000D， 把 这 个 地 址 的 字 节 放 到 总 线 上 。 然 
后 CPU 从 系统 总 线 取 得 这 个 数值 ， 并 将 它 装 人 累加 器 的 右 半 部 分 。 

图 4-34g 显示 执行 周期 的 取 指 令 部 分 。 这 次 CPU 检测 到 PC 里 的 内 容 为 0003 (hex), F 
是 它 取 出 地 址 0003 处 的 一 个 字 节 内 容 的 副本 ， 发 现 指令 不 是 一 元 指令 ， 接 着 获取 在 地 址 
0004 处 的 一 个 字 ， 这 样 做 的 结果 是 改变 了 IR 的 原始 内 容 。 

图 4-34h 是 执行 周期 的 PC 增加 部 分 ，CPU 给 PC 加 0003 得 到 0006 (hex). 

4-34i 显示 执行 周期 的 执行 部 分 。CPU 检测 到 IR 的 前 4 位 为 1111， 此 操作 码 给 电路 
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发 信号 ， 执 行 字 节 存 储 指令 。CPU 检测 r 字 段 ， 发 现 其 值 为 0， 表 示 是 累加 器 ; 检测 aaa F 
址 字段 ， 发 现 其 值 为 001， 表 示 是 直接 寻 址 。 接 着 CPU 检测 操作 数 指示 符 ， 其 内 容 为 FC16 
(hex)， 于 是 把 累加 器 右 半 部 分 的 字 节 放 到 总 线 上 ， 并 向 主 存 发 控制 信号 ， 把 该 值 从 总 线 存 
储 到 地 址 FC16， 这 个 地 址 就 是 输出 设备 。 输 出 设备 将 这 个 字 节 解释 为 ASCII 字符 H， 并 显 
示 在 屏幕 上 。 

图 4-34j 显示 执行 周期 的 取 指令 部 分 ， 因 为 PC 包含 0006 (hex)， 所 以 这 个 地 址 的 字 节 
来 到 CPU。 这 次 当 CPU 检测 操作 码 时 ， 发 现 指令 不 是 一 元 指令 ， 因 此 它 获取 在 地 址 0007 
处 的 一 个 字 。 

图 4-34k 显示 执行 周期 的 PC 增加 部 分 ，CPU 给 PC 加 0003 得 到 0009 (hex). 

图 4-341 显示 执行 周期 的 执行 部 分 。 和 了 一 样 ，CPU 执行 的 是 字 节 装 入 指令 ， 但 这 次 是 
从 地 址 000E 装 入 ， 该 地 址 保存 的 是 字母 i 的 ASCII 码 。 图 中 没有 显示 最 后 两 条 指令 的 执行 
情况 : 第 一 条 指令 把 字母 i 发 送 到 输出 设备 ， 第 二 条 指令 停止 程序 执行 。 


Mem 














D1000D D1000D 


D1000E D1000E 


| oo | | 0 | 











D1000D D1000D 


D1000E D1000E 


| 00 | 
PC| 0003 | : PC| 0003 | 
IR[ D1000D | IR[_D10000 ] 





e ) 增加 PC f) 执行 : 将 字母 了 装 人 累加 器 
图 4-34 图 4-33 所 示 程 序 的 冯 : 诺 依 曼 执行 周期 
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i) 执行 : 从 累加 器 向 输出 设备 存储 字 节 j) 从 Mem[PC] 取 指 
Mem Mem 

0000 | D1000D 0000 | D1000D 

0003 | FIFC16 0003 | FIFC16 | 

CPU 0006 | D1000E CPU D1000E 
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000C| o0 | — | 00 | 
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k) 增加 PC 1) 执行 : 将 字母 i 装 人 累加 器 
图 4-34 ( 续 ) 


仅仅 输出 两 个 字符 看 上 去 都 是 有 点 儿 复 杂 的 过 程 ， 但 对 于 人 类 来 说 它 执 行 得 相当 快 ， 许 
多 计算 机 执行 周期 的 取 指 部 分 只 需 大 约 不 到 1 纳 秒 的 时 间 。 因 为 执行 周期 的 执行 部 分 取决 于 
指令 的 类 型 ， 因 此 执行 复杂 的 指令 可 能 需要 很 多 纳 秒 ， 而 执行 简单 的 指令 只 需要 几 个 纳 秒 的 
时 间 。 

计算 机 不 会 给 它 电路 中 的 电子 信号 附加 任何 含义 。 有 具体 来 说 ， 主 存 不 知道 一 个 特定 地 址 
的 位 是 代表 数据 还 是 指令 ， 它 只 知道 是 1 和 0。 


4.3.3 0B - 诺 依 曼 漏洞 

在 图 4-33 的 程序 中 ， 地 址 0000 到 000C 的 位 被 CPU 作为 指令 ，000D 和 000E 的 位 作 
为 数据 。 因 为 程序 员 知 道 PC 的 初始 值 是 0000， 在 每 一 个 执 和 周期 的 循环 会 被 加 0001 或 
0003, ， 所 以 他 把 指令 位 放 在 开头 。 如 果 犯 错 遗 漏 了 停止 指令 〈 操 作 码 0000 0000 )， 尽 管 程序 
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员 的 本 意 是 想 要 把 下 面 的 字 节 解释 为 数据 ， 但 执行 周期 将 会 继续 获取 下 面 的 字 节 ， 把 它 当 作 
下 一 条 指令 的 指令 指示 符 来 解释 。 

因为 程序 和 数据 共享 内 存 ， 所 以 机 器 层 程序 员 在 为 它们 分 配 内 存 时 必须 要 小 心 仔 细 ， 否 
则 会 出 现 两 种 类 型 的 问题 : 一 种 是 CPU 可 能 会 把 程序 员 想 作为 数据 的 位 序列 解释 为 指令 ， 
为 一 种 是 CPU 把 程序 员 想 作为 指令 的 位 序列 解释 为 数据 。 这 两 种 类 型 的 漏洞 都 发 生 在 机 
fitz o 

虽然 如 果 程 序 员 不 仔细 ， 程 序 和 数据 共享 内 存 会 产生 漏洞 ， 但 是 这 也 带 来 了 令 人 激动 的 
潜在 可 能 。 程 序 只 是 存储 在 内 存 中 的 一 组 指令 ， 因 此 程序 员 可 以 把 一 个 程序 看 作 另 一 个 程序 
的 数据 。 这 使 得 写 一 个 用 于 处 理 另 一 个 程序 的 程序 成 为 可 能 。 编 译 程序 、 汇 编程 序 和 装载 器 
采用 的 都 是 把 其 他 程序 当 作 数 据 这 一 观点 。 


4.3.4 一 个 字符 输入 程序 
机 器 语言 (bin ) 


图 4-35 的 程序 从 输入 设备 输入 1101 0001 1111 
两 个 字符 ， 再 以 着 序 在 输出 设备 输 1111 0001 0000 
出 。 使 用 直接 寻 址 方式 的 字符 输入 指 rp ed 
令 从 输入 设备 获得 字符 。 1101 0001 0000 
第 一 条 指令 DIFC15， 其 操作 1111 0001 1111 
码 指明 从 输入 设备 装 人 一 个 字 节 到 Haiya 
Mem[FC15]， 寄 存 器 r 字 段 表明 是 A =k 
= ee 5 D1FC15 ;Input first character 
RIE, 寻 址 aaa 字段 表明 为 直接 寻 F10013 ;Store first character 
hk. 它 把 来 自 输 入 设备 的 第 一 个 字 节 D1FC15 ;Input second character 
放 人 累加 器 的 右 半 部 分 。 第 二 条 指令 F1FC16 ;Output second character 
p D10013 ;Load first character 
F10013, 其 操作 码 指明 从 累加 器 存 F1FC16 ;Output first character 
储 一 个 字 节 到 Mem[0013]。 虽 然 这 个 00 ;Stop 


字 节 没有 显示 在 程序 代码 中 ,但 它 一 
定 是 可 用 的 ， 因 为 主 存 的 最 高 地 址 是 
FFFF. 

第 三 条 指令 DIFC15 和 第 一 条 
类 似 ， 输 入 第 二 个 字符 到 累加 器 的 图 4-35 一 个 机 器 语言 程序 输入 两 个 字符 并 逆序 输出 
右 半 部 分 。 第 四 条 指令 FIFC16, 其 
操作 码 指明 存储 字 节 ， 寄 存 器 rz 字 段 指明 是 累加 器 ， 寻 址 aaa 字段 指明 为 直接 寻 址 。 它 从 
累加 器 发 送 一 个 字 节 到 位 于 Mem[FC16] 的 输出 设备 。 第 五 条 指令 D10013 把 之 前 存储 在 
Mem[0013] 的 第 一 个 字符 装 和 累加 器 。 倒 数 第 二 条 指令 FIFC16 把 第 一 个 字符 从 累加 器 发 送 
到 位 于 Mem[FC16] 的 输出 设备 。 最 后 一 条 指令 停止 程序 执行 。 


4.3.5 十进制 转换 为 ASCII 

图 4-36 展示 了 一 个 程序 ， 它 把 两 个 一 位 数字 相 加 ， 输 出 它们 一 位 数 的 和 。 这 个 程序 说 
明 在 机 器 层 处 理 输出 的 不 便 性 。 

两 个 加 数 是 5 和 3， 程 序 把 它们 存储 在 Mem[000D] 和 Mem[000F]。 第 一 条 指令 把 5 装 
入 累加 器 ， 接 着 第 二 条 指令 把 累加 器 加 3， 此 时 和 在 累加 器 里 。 
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现在 问题 出 现 了 。 我 们 想 输 出 这 个 结果 ， 但 是 ISA3 层 唯一 的 输出 指令 是 把 一 个 
ASCII 格 式 的 字 节 存储 到 位 于 一 一 一 
Mem[FC16] 的 输出 设备 。 问 题 HUER (th) 


1100 0001 0000 
是 结果 为 0000 1000 (bin), ane 0110 0001 0000 
用 字 节 存储 指令 输出 它 ， 会 把 它 1001 0001 0000 
1111 0001 1111 
解释 为 退 格 键 BS， 如 图 3-25 的 ein: ONA 
ASCII 表 所 示 。 0000 0000 0000 
因此 ， 程 序 必 须 把 十 进 制 0000 0000 0000 
数 8， 即 0000 1000 (bin)， 转 换 We 
为 ASCII 字 符 8， 即 0011 1000 SE os 
i spins —_ C1000D ;A<-first number 
(bin). ASCII 位 与 无 符号 二 进 制 61000F ;Add the two numbers 
位 不 同 ， 它 在 第 三 和 第 四 位 有 两 910011 ;Convert sum to character 
个 l 为 了 实现 这 个 转换 ， 程序 ;Output the character 
7St 
用 寄存 器 OR IESG Bin Be AH es a 
#4 0000 0000 0011 0000 进行 或 运 ;Decimal 3 
算 在 结果 中 插入 两 个 额外 的 i ;Mask for ASCII char 


0000 0000 0000 1000 
OR 0000 0000 0011 0000 
0000 0000 0011 1000 图 4-36 一 个 机 器 语言 程序 : 计算 5 加 3， 并 输出 单字 符 结果 
现在 累加 器 包含 ASCII 格式 
的 正确 的 和 ， 字 节 存 储 指令 把 这 个 字符 发 送 到 输出 设备 。 
如 果 把 Mem[000F] 的 字 蔡 换 为 0009， 那 么 程序 会 输出 什么 ?尽管 累加 器 中 的 和 在 执行 
累加 器 加 法 指令 后 是 
14 (dec) = 0000 0000 0000 1110 (bin) 
但 遗憾 的 是 ， 它 不 会 输出 14. OR 指令 会 把 这 个 位 模式 变 为 0000 0000 0011 1110 (bin), 
产生 的 输出 是 >。 因为 ISA3 层 唯一 的 输出 指令 只 能 输出 单个 字 节 ， 所 以 程序 不 能 输出 包含 
大 于 1 个 字符 的 结果 。 在 第 5 章 中 ,我 们 将 看 到 如 何 补救 这 个 缺点 。 


4.3.6 ”一 个 自我 修改 程序 


图 4-37 说 明了 基于 汉 … 诺 依 曼 设计 原理 的 一 个 奇特 的 可 能 性 。 我 们 注意 到 这 个 程序 从 
0006 ~ 0017 和 图 4-36 的 从 0000 一 0011 是 一 样 的 ， 然而 在 这 个 程序 开始 的 地 方 有 两 条 指 
SEA 436 中 没有 的 。 因 为 指令 往 下 移 了 6 个 字 节 ， 所 以 它们 的 操作 数 指示 符 也 比 前 面 程 
序 的 大 了 6。 除 了 有 6 个 字 节 的 调整 外 ， 从 0006 开始 的 指令 会 重复 图 4-36 的 处 理 过 程 。 

尤其 是 ， 装 和 累加 器 指令 把 5 装 人 累加 器 ， 加 法 指令 对 累加 器 加 3，OR 指令 把 (dec) 
变 为 ASCII 的 8， 累 加 器 字 节 存储 指令 把 ASCII 字符 8 发 送 给 位 于 Mem[FC16] 的 输出 设 
备 。 但 是 ,输出 却 是 2。 

AES + 诺 依 曼 计算 机 中 程序 和 数据 共享 同一 个 内 存 ， 所 以 程序 有 可 能 把 它 自己 当 作 
数据 并 进行 修改 。 第 一 条 指令 把 字 节 71 (hex) 装 入 累加 器 的 右 半 部 分 ， 接 着 第 二 条 指令 把 
它 放 入 Mem[0009]。 在 这 个 修改 之 前 Mem[0009] 的 内 容 是 什么 ?是 累加 器 加 法 指令 的 指令 
指示 符 。 现 在 Mem[0009] 的 位 是 0111 0001。 当 计算 机 在 冯 : 诺 依 曼 执 行 周期 的 取 指 部 分 得 





到 这 些 位 时 ，CPU 检测 到 操作 码 为 0111， 
寻 址 方式 位 显示 是 直接 寻 
址 。 指 令 从 5 减 去 3 而 不 是 
加 3。 

当然 ， 这 并 不 是 一 个 非 
常 实际 的 程序 。 如 果 想 对 两 
个 数 进行 减法 运算 ， 可 以 简 
单 地 用 减法 指令 代替 加 法 指 
令 ， 写 图 4-36 的 程序 就 可 
以 了 。 但 是 它 确实 表明 在 
冯 “' 庄 依 曼 计算 机 中 ， 主 存 
不 会 赋予 它 正 在 存储 的 位 任 
何 含义 ， 它 只 知道 1 和 0， 
并 不 知道 哪些 是 程序 位 、 哪 
些 是 数据 位 、 哪 些 是 ASCII 
字符 等 。 此 外 ，CPU 遵循 
+ 诺 依 曼 执 行 周期 ， 相 应 
地 解释 位 ， 并 不 了 解 它们 的 
历史 。 当 获取 在 Mem[0009] 
的 位 时 ， 它 不 知道 也 不 在 
意 这 些 位 是 怎么 样 到 这 里 
的 ， 它 只 是 简单 地 一 再 重 
复 取 指 、 译 码 、 增 加 PC 和 
执行 。 


x86 处 理 器 系列 是 指 Intel 从 1978 
= 到 80186/ 
80286/80386/80486 系 列 、 奔腾 系列 和 Lb 


年 推出 的 8086 开 始 ， 


Core 系列 。 其 CPU 寄存 器 的 大 小 不 断 变 
化 ，8086 为 16 位 ， 
Pentium 4 开始 为 64 位 。 这 些 处 理 
般 都 是 向 后 兼容 的 。 比 如 ，， 





图 4-37 一 个 修改 自身 的 机 器 语言 


80386 4 32t, M 
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是 寄存 器 减法 指令 ， 寄 存 器 指示 符 表 示 是 累加 器 ， 


机 器 语言 ( bin ) 

1101 0001 0000 0000 1001 
1111 0001 0000 0000 1001 
1100 0001 0000 0000 0011 
0110 0001 0000 0000 0101 
1001 0001 0000 0000 0111 
1111 0001 1111 1100 0110 
0000 0000 

0000 0000 0000 0101 

0000 0000 0000 0011 

0000 0000 0011 0000 

0111 0001 


机 器 语言 ( hex ) 


D10019 
F10009 
C10013 
610015 ;Add the two numbers 
910017 
F1FC16 


;Load byte accumulator 
¿Store byte accumulator 
;A<-first number 


;Convert sum to character 
;Output the character 

;Stop 

;Decimal 5 

;Decimal 3 

;Mask for ASCII char 

;Byte to modify instruction 


序 ， 加 法 指令 变 成 了 减法 指令 


与 Pep/9 对 应 的 四 个 状态 位 的 位 置 。SF 


代表 符号 标志 ，OF RABE. 


有 32 位 执行 模式 ， 这 样 之 前 的 软件 可 以 。 EX| 


不 经 修改 就 在 新 CPU 上 运行 。 


图 4-38 展 示 了 典型 的 32 位 模式 的 
寄存 器 。x86 处 理 器 是 小 端 序 ， 对 寄存 器 


位 编号 时 ， 基 最低 有 效 位 编号 为 0。 除了 


Pep/9 中 的 NZVC 四 个 位 之 外 ，EFLAGS 


寄存 器 还 有 很 多 状态 位 。 图 4-39 给 出 了 





图 4-38 Per 32 位 ; x86 cpu 寄存 器 






4.4 






bp awk = Pa 


BREE eet, 


Te a Sei Rip A OLE 
Sik Reena had eae 


器 ，EDI 是 目的 变 址 寄存 器 。 ESP ZR 
Ht, ALT Pepio DRAHE SP. 





ENER, CTE 
ee eee eT Le 


ISA3 层 的 编程 


ISA3 层 编程 就 是 写 一 组 二 进 制 指令 
系统 负责 把 二 进 制 序列 装 人 主 存 。 
操作 系统 就 是 一 个 程序 。 


IRRE (#3 #) 






= 


EBP 是 基 址 指针 ， 指 向 当前 栈 帧 的 底部 。 
Pep/9 没 有 与 之 对 应 的 寄存 器 EIP 在 
Intel 中 被 称 为 指令 指针 ， 对 应 于 Pep/9 
的 程序 计数 器 PC。 

图 4-40 给 出 了 一 条 机 器 语言 指令 ， 
它 把 ECX HHA Am | EAX FFB 
内 容 ， 并 把 和 数 送 入 ECX 寄存 器 。 与 所 
有 汉 … 诺 依 曼 机 器 一 样 ， 机 器 语言 指令 
以 操作 码 字 段 开始 ， 本 例 中 为 000000， 
它 是 加 法 指令 的 操作 码 。 后 面 的 字段 对 
应 于 Pep/9 th & Br FRAT aaa F 
段 ， 但 是 其 含义 是 特 属 于 x86 指令 集 的 。 
s 字 段 中 的 1 表示 和 数 是 32 位 的 。 如 果 
s 字 我 的 值 为 0， 那 么 只 能 加 一 个 学 节 。 


5 | :mod 字段 中 的 1T 表 示 mm 字 段 是 寄存 
NORMA RARER ET 


“Pep/9 的 又 寄存 器 : ESI 是 源 变 址 寄存 


Ee reg 字段 中 的 000 与 4 字段 中 的 0 一 ， 
起 指定 EAX 寄存 器 ,tm 字段 中 的 001 
与 d 字 段 中 的 0 一 起 指定 ECX 寄存 器 。 


该 指令 的 十 六 进 制 缩写 为 01C1。 


o tyi, mod reg rim 
ee CCC p ol 07 


”图 4-40 寄存 器 加 法 指令 的 x86 指令 格式 


“ 引 字 节 。 指 念 格式 如 此 复杂 的 原因 是 ， 


要 执行 





ERAS CPU 演变 而 来 ， 而 且 要 能 向 后 
” ”兼容 。Pep/9 WAT Hae + ik BILE 


PHSB EMEA, BART sir 
的 复杂 性 。 


二 进 制 序列 ， 首 先 要 把 它 装 入 主 存 。 操 作 


与 任何 其 他 程序 一 样 ， 软 件 工程 师 必须 设计 、 编 写 、 测 试 和 


调试 操作 系统 。 大 多 数 操作 系统 非常 庞大 和 复杂 ， 必 须 由 一 个 工程 师 团队 来 编写 。 操 作 系 
统 的 主要 功能 是 控制 应 用 程序 在 计算 机 上 的 执行 。 因 为 操作 系统 本 身 也 是 一 个 程序 ， 所 以 
要 执行 操作 系统 ， 它 也 必须 在 主 存 中 。 因 此 在 主 存 中 不 仅 要 存储 应 用 程序 ， 也 要 存储 操作 
系统 。 

在 Pep/9 计算 机 中 ， 主 存 的 底部 ( 主 存 高 地 址 部 分 ) 保留 给 操作 系统 ， 顶 部 保留 给 应 用 
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程序 。 图 4-41 展示 了 Pep/9 计算 机 系统 的 主 存 。 如 图 所 示 ， 操 作 系统 占用 了 从 FB8F 开始 的 

主 存 ， 剩 下 的 地 址 从 0000 到 FB8E 用 于 应 用 

程序 。 Mem 
操作 系统 的 装载 器 (loader) 把 应 用 程序 na 

装 人 主 存 ， 这 样 程序 才能 执行 。 那 么 什么 来 应 用 程序 

装 人 装载 器 呢 ? Pep/9 的 装载 器 和 操作 系统 的 

许多 其 他 部 分 是 永和 久 存 储 在 主 存 中 的 。 


4.4.1 只 读 存 储 器 


制造 内 存 设备 的 电子 电路 元 件 有 两 种 : 
读 / 写 电 路 元 件 和 只 读 电路 元 件 。 

在 图 4-35 所 示 的 程序 中 ， 当 执行 字 节 存 
储 指令 F10013 时 ，CPU 把 累加 器 右 半 部 分 的 
内 容 传送 到 Mem[0013]，Mem[0013] 的 原始 
内 容 被 破坏 ， 现 在 内 存 位 置 内 容 为 0111 0101 
(bin)， 字 母 u 的 二 进 制 编码 。 当 执行 字 节 装 
人 指令 D10013 时 ，0013 处 的 位 就 被 送 回 累 
加 器 ， 以 便 将 它们 发 送 给 输出 设备 。 

内 存 位 置 0013 的 电路 元 件 是 读 / 写 电 
路 。 字 节 存 储 指 令 对 它 进 行 了 写 操作 ， 使 它 
的 内 容 发 生 改变 ， 字 节 读 取 指 令 对 它 进 行 了 
一 个 读 操 作 ， 把 它 内 容 的 副本 发 送 到 累加 器 。 
如 果 0013 的 电路 元 件 是 只 读 电路 ， 那 么 字 节 E44 Pep/9 的 主 存 ， 阴 影 部 分 是 只 读 存储 器 
存储 指令 不 会 改变 它 的 内 容 。 

相对 于 串 行 设 备 ， 主 存 电路 元 件 的 两 种 类 型 一 读 / 写 和 只 读 ， 都 是 随机 存 取 设 备 。 当 
字 节 装 和 指令 对 内 存 位 置 0013 进行 读 操作 时 ， 它 不 需要 从 0000 开始 依 序 经 过 0001、0002、 
0003 等 直到 0013 ， 它 能 直接 找到 位 置 0013。 因 为 它 可 以 直接 访问 内 存 的 任意 位 置 ， 所 以 这 
种 电路 元 件 叫 作 随机 存 取 设备 。 

只 读 内 存 设 备 称 为 ROM。 读 / 写 内 存 设备 应 该 称 为 RWM， 遗 憾 的 是 ， 它 们 称 为 RAM, 
表示 随机 存 取 内 存 。 很 遗憾 叫 这 个 名 字 ， 因 为 只 读 和 读 / 写 设备 都 是 随机 存 取 设备 。 区 别 只 
读 内 存 设 备 和 读 / 写 内 存 设备 的 特性 是 只 读 内 存 设备 的 内 容 不 能 被 存储 指令 改变 。 由 于 在 计 
算 机 行业 中 RAM 这 个 词 的 使 用 是 如 此 的 普遍 ， 所 以 我 们 也 用 它 来 指 代 读 / 写 内 存 设备 ,但 
是 在 心里 ， 我 们 知道 ROM 也 是 随机 存 取 的 。 

主 存 中 通常 包含 一 些 ROM 设备 。 这 些 部 分 是 包含 永久 二 进 制 序列 的 ROM， 存 储 指令 
是 不 能 改变 的 。 此 外 ， 每 天 结束 时 关机 和 每 天 开始 时 开机 ， 这 些 二 进 制 序列 都 保持 在 ROM 
的 电路 中 。 如 果 关 机 ，RAM 不 会 保留 它 的 记忆 ， 因 此 它 又 称 为 易 失 的 (volatile). 

计算 机 厂商 给 内 存 系 统购 买 ROM 有 两 种 方法 。 第 一 种 方式 是 计算 和 厂商 向 电路 厂商 指 
定 内 存 设备 中 希望 的 位 序列 ， 然 后 电路 厂商 相应 地 生产 设备 ; 或 者 是 计算 机 厂商 订购 可 编程 
只 读 内 存 (PROM). 这 是 一 种 全 0 的 ROM， 计算 机 厂商 可 以 把 任意 希望 的 位 置 永久 地 变 为 
1。 用 这 样 的 方法 ,设备 将 包含 适当 的 位 序列 。 这 个 过 程 叫 作 “ 烧 人 ”位 模式 。 
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4.4.2 Pep/9 操作 系统 

Pep/9 操作 系统 的 大 部 分 都 已 经 烧 人 ROM。 图 4-41 中 的 阴影 部 分 就 是 操作 系统 的 ROM 
部 分 ， 它 从 FC17 开始 一 直到 FFFF， 这 部 分 主 存 是 永久 不 变 的 ， 存 储 指 令 不 能 改变 它 。 如 
果 掉 电 ， 又 上 电 ， 操 作 系 统 的 这 个 部 分 仍然 在 这 里 。 从 FB8F 到 FC16 的 区 域 是 计算 机 操作 
系统 的 RAM 部 分 。 

操作 系统 的 RAM 部 分 用 来 存储 系统 变量 和 内 存 映 射 的 1/0 设备 。 当 操作 系统 程序 执行 
时 ， 变 量 的 值 会 改变 。 操 作 系统 的 ROM 部 分 包含 装载 器 ， 它 是 永久 固定 的 。 它 的 工作 是 把 
应 用 程序 装 入 从 地 址 0000 开始 的 RAM. 在 Pep/9 虚拟 机 上 ， 通 过 从 模拟 器 程序 菜单 中 选择 
装载 器 选项 来 调用 装载 器 。 

应 用 程序 运行 时 栈 的 底部 叫 作 用 户 栈 ， 从 内 存 位 置 FB8F 开始 ， 正 好 在 操作 系统 的 上 
面 。CPU 中 的 栈 指针 寄存 器 存放 栈 顶 的 地 址 。 当 程序 被 调用 时 ， 会 在 栈 上 分 配 参数 、 返 
回 地 址 和 局 部 变量 的 存储 空间 ， 从 较 低 的 地 址 开始 连续 分 配 ， 因 此 栈 在 内 存 中 是 “向 上 生 
长 的 ”。 

操作 系统 的 运行 时 栈 从 内 存 位 置 FCOF 开始 ， 它 位 于 用 户 栈 起 始 往 下 128 字 节 的 位 置 。 
当 操作 系统 执行 时 ，CPU 中 的 栈 指针 包含 系统 栈 顶 的 地 址 。 与 用 户 栈 一 样 ， 系 统 栈 在 内 存 
中 也 是 向 上 生长 的 。 操 作 系 统 的 栈 绝 不 会 超过 128 字 节 ， 因 此 系统 栈 不 可 能 试图 把 它 的 数据 
存储 在 用 户 栈 的 范围 内 。 

Pep/9 操作 系统 由 两 个 程序 组 成 : 开始 于 地 址 FC17 的 装载 器 和 开始 于 地 址 FC52 的 陷阱 
处 理 程序 。 看 图 4-6 你 会 记得 ， 在 ISA3 层 操 作 码 从 0010 011 到 0010 1 的 指令 是 未 实现 的 ， 
陷阱 处 理 程序 把 这 3 条 指令 实现 给 汇编 语言 程序 员 。 第 5 章 会 讲述 Asmbs 汇编 层 的 这 些 指 
S, 第 8 章 将 展示 在 OS4 操作 系统 层 是 如 何 实现 它们 的 。 

与 操作 系统 这 两 个 部 分 相关 的 是 ROM 最 底部 的 6 个 


FS, 它们 被 操作 系统 保留 为 特殊 用 途 ， 称 为 机 器 向 量 ,， 地 pat ene (EER) FE 
址 分 别 是 FFF4、FFF6、FFF8、FFFA、FFFC fil FFFE, 4 
图 4-41 所 示 。 FFFC P 


“4M Pep/9 模拟 器 菜单 选择 装 入 选项 时 ， 发 生 了 下 列 
两 个 事件 : 

SP +— Mem[FFF6] 

PC — Mem[FFFC] 
换 名 话说， 内 存 位 置 FFF6 的 内 容 被 复制 到 栈 指针 ， 内 存 位 
置 FFFC 的 内 容 被 复制 到 程序 计数 器 。 这 两 个 事件 发 生 后 ， 
执行 周期 开始 。 图 4-42 展示 了 这 两 个 事件 。 

选择 装 人 选项 会 把 栈 指针 和 程序 计数 器 初始 化 为 存储 
在 FFF6 和 FFFC 中 的 预定 值 。 地 址 FFF6 的 值 正好 是 系统 
栈 的 底部 FCOF ， 也 就 是 系统 栈 为 空 时 栈 指针 的 值 。 而 地 址 
FFFC 的 值 正好 是 FC17， 实 际 上 ， 它 是 装载 器 中 要 执行 的 
第 一 条 指令 的 地 址 。 

写 操作 系统 的 系统 程序 员 决 定 系统 栈 和 装载 器 应 该 
在 什么 位 置 。 因 为 当选 择 装 人 选项 时 ，Pep/9 计算 机 会 从 c) PC < Mem[FFFC] 
FFF6 和 FFFC 获取 向 量 ， 系 统 程序 员 会 在 这 些 位置 放 置 适 图 4-42 Pep/9 加 载 选项 
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当 的 值 。 由 于 执行 周期 的 第 一 步 是 取 指 令 ， 所 以 选择 装 入 选项 后 第 一 条 要 执行 的 指令 就 是 装 
载 器 的 第 一 条 指令 。 

如 果 想 修改 操作 系统 ， 装载 器 不 从 FC17 开始 ， 假 定 从 7BD6 开始 ， 当 用 户 选择 装 人 选 
项 时 ， 计 算 机 仍 将 去 FFFC 获取 向 量 ， 因 此 需要 把 7BD6 放 在 地 址 FFFC 处 。 

这 种 在 特殊 保留 内 存 位 置 中 存储 地 址 的 方案 具有 很 好 的 灵活 性 ， 它 允许 系统 程序 员 把 装 
载 器 放 在 内 存 中 任何 方便 的 位 置 。 一 个 更 直接 但 是 缺乏 灵活 性 的 方案 是 把 计算 机 系统 设计 成 
当 用 户 选 择 装 和 人 选项 时 ， 执 行 下 列 操作 : 

SP — FCOF 

PC — FCI7 

如 果 选 择 装 入 选项 会 产生 这 两 个 事件 ， 那 么 当前 操作 系统 的 装载 器 仍然 能 正确 工作 。 但 
是 修改 操作 系统 会 很 困难 。 装 载 器 不 得 不 总 是 从 FC17 开始 ， 系 统 栈 会 不 得 不 总 是 从 FCOF 
开始 ， 系 统 程 序 员 不 能 选择 系统 各 个 部 分 的 放置 位 置 。 


4.4.3 ”使 用 Pep/9 系统 


所 幸 的 是 ， 要 在 Pep/9 计算 机 上 装 人 一 个 机 器 语言 程序 ， 不 一 定 非 要 用 二 进 制 来 编写 这 
个 机 器 语言 程序 ， 可 以 在 文本 文件 中 用 ASCII 十 六 进 制 字符 进行 编写 。 当 装载 器 装 人 这 个 
程序 时 会 把 它 从 ASCH 转换 到 二 进 制 。 

图 4-43 中 的 代码 展示 了 怎样 准备 一 个 机 器 语言 程序 以 便装 入 。 这 是 图 4-33 中 的 程序 ， 
输出 Hi。 可 以 在 文本 文件 中 编写 十 六 进 制 形式 的 二 进 制 序列 ， 不 需要 任何 地 址 或 注释 。 以 
小 写 的 zz 结束 字 节 列表 ， 装 载 器 会 把 zz 作为 一 个 标记 符号 。 装 载 器 将 把 这 些 字 节 逐个 送信 
内 存 中 从 0000 (hex) 开始 的 地 址 中 。 








地 址 机 器 语言 ( bin ) 
0000 D1000D ;Load byte accumulator 'H' 

0003 FIFC16 ;Store byte accumulator output device 
0006 D1000E ;Load byte accumulator 'i' 

0009 F1FC16 ;Store byte accumulator output device 
000C 00 ; Stop 

000D 4869 ;ASCII "Hi" characters 












Hex Version for the Loader 
D1 00 OD Fl FC 16 D1 00 OF F1 FC 16 00 48 69 zz 





图 4-43 ”为 装载 器 准备 程序 


Pep/9 装载 器 对 机 器 语言 程序 的 格式 是 非常 挑剔 的 。 为 了 正确 地 工作 ， 文 本 文件 中 的 第 
一 个 字符 必须 是 十 六 进 制 字符 ， 开 头 不 允许 有 空 行 或 空格 ， 字 节 之 间 必 须 有 且 只 能 有 一 个 空 
格 。 如 果 字 节 流 要 从 新 的 一 行 开 始 ， 上 一 行 的 结尾 一 定 不 能 有 空格 。 

在 编写 完 机 器 语言 程序 并 用 装载 器 选项 把 它 装 入 之后， 必须 选择 执行 选项 去 运行 它 。 当 
选择 执行 选项 时 ， 发 生 下 面 两 个 事件 : 

SP +— Mem[FFF4] 

PC — 0000 
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AED + ARS PTT ASE a. FA PC 的 值 是 0000， 所 以 CPU 将 从 Mem[0000] 处 获 
取 第 一 条 指令 ， 装 载 器 刚好 把 应 用 程序 的 第 一 条 指令 放 在 这 里 。 

图 4-41 表明 Mem[FFF4] 的 内 容 是 FB8F， 这 是 用 户 栈 的 底部 地 址 。 本 例 中 的 应 用 程序 
不 使 用 运行 时 栈 。 如 果 应 用 程序 要 用 到 运行 时 栈 ， 因 为 SP 被 初始 化 为 用 户 栈 底部 的 地 址 ， 
所 以 程序 能 够 正确 地 访问 栈 。 

好 好 享受 你 现在 学 到 的 知识 吧 ! 


本 章 小 结 


几乎 所 有 的 商用 计算 机 都 是 基于 汉 “ 诺 依 曼 设 计 原 理 的 ， 这 个 原理 中 主 存 既 存储 数据 也 
存储 指令 。 汉 ， 诺 依 曼 机 器 的 三 个 组 成 部 分 是 中 央 处 理 单元 (CPU )、 包 含 内 存 映射 IO 设备 
的 主 存 和 磁盘 。CPU 包含 一 组 寄存 器 ， 其 中 一 个 寄存 器 是 程序 计数 器 ( PC)， 它 存储 下 一 条 
要 执行 指令 的 地 址 。 

CPU 有 一 组 固化 在 其 中 的 指令 集 。 一 条 指令 由 指令 指示 符 和 操作 数 指示 符 组 成 。 指 令 
指示 符 依次 由 操作 码 、 可 能 有 的 寄存 器 字段 和 寻 址 方式 字段 组 成 。 操 作 码 用 来 确定 要 执行 指 
令 集中 的 哪 条 指令 ， 寄 存 器 字段 用 来 确定 哪个 寄存 器 参与 运算 ， 寻 址 方式 字段 用 来 确定 源 或 
目的 数据 使 用 哪 种 寻 址 方式 。 

每 种 寻 址 方式 对 应 于 一 种 操作 数 指示 符 (OprndSpec) 和 操作 数 (Oprnd) 之 间 的 关 
系 。 对 于 直接 寻 址 方式 ， 操 作 数 指示 符 是 主 存 中 操作 数 的 地 址 ， 数 学 表示 为 : Oprnd = 
Mem[OprndSpec]。 

要 执行 一 个 程序 ， 需 要 把 一 组 指令 和 数据 装 入 主 存 ， 然 后 汉 “' 诺 依 曼 执 行 周期 开始 
汉 . 诺 依 曼 执 行 周期 由 下 列 步 双 组 成 ， 1 ) 获取 PC 指定 的 指令 ; 2 ) 对 指令 指示 符 译 码 ; 3 ) 
增加 PC; 4 ) 执行 取出 的 指令 ; 5 ) 返回 第 一 步 重复 进行 。 

由 于 主 存 既 存储 指令 也 存储 数据 ， 所 以 在 机 器 层 有 可 能 出 现 两 种 类 型 的 问题 。 可 以 把 数 
据 位 解释 为 指令 ， 或 者 可 以 把 指令 位 解释 成 数据 。 此 外 还 有 一 种 可 能 性 ， 把 指令 存储 在 主 在 
中 的 直接 后 果 是 可 以 像 处 理 数据 一 样 处 理 程序 。 装 载 器 和 编译 器 是 使 用 把 指令 位 当 作 数 据 这 
一 观点 的 重要 程序 。 

操作 系统 是 控制 应 用 程序 执行 的 一 个 程序 ， 它 必须 与 应 用 程序 和 数据 一 起 位 于 主 存 中 。 
在 某 些 计算 机 中 ,操作 系统 的 一 部 分 烧 人 只 读 内 存 (ROM) 中 。ROM 的 一 个 特性 是 存储 指 
令 改变 不 了 内 存单 元 的 内 容 。 操 作 系 统 的 运行 时 栈 位 于 随机 存 取 内 存 (RAM) 中 。 机 器 向 量 
是 操作 系统 组 成 部 分 的 地 址 ， 例 如 栈 或 者 程序 ， 它 用 于 访问 这 个 组 成 部 分 。 装 载 器 和 陷阱 处 
理 程序 是 操作 系统 的 两 个 重要 功能 单元 。 


练习 


4.1 节 
*1. (a) Pep/9 计算 机 的 主 存 有 多 少 字 节 ? 
(b) 有 多 少 个 字 ? 
(c) 有 多 少 位 ? 
a eg Dos eri 
) 以 位 来 度量 ， 主 存 比 CPU 大 多 少 倍 ? 
Be niente 一 元 指令 ， 那 么 包含 多 少 一 元 指令 ? 


+3. 


4. 
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(b) 如 果 所 有 指令 都 不 是 一 元 指令 .能 容纳 多 少 指令 ? 

(c) 假定 主 存 中 全 是 一 元 和 非 一 元 指令 ， 且 它们 的 数量 相同 ， 那 么 总 共 能 容纳 多 少 指令 ? 
回答 有 关机 器 语言 指令 6AF82C 和 D623D0 的 下 列 问 题 。 

(a) 二 进 制 表示 的 操作 码 是 什么 ? 

(b) 指令 是 做 什么 的 ? 

(c) 二 进 制 表示 的 寄存 器 了 字段 是 什么 ? 

(d) 它 指 定 的 是 哪 一 个 寄存 器 ? 

(e) 二 进 制 表 示 的 寻 址 aaa 字段 是 什么 ? 

(f) 它 指定 的 是 哪 种 寻 址 方式 ? 

(g) 十 六 进 制 表 示 的 操作 数 指 示 符 是 什么 ? 

对 于 机 器 语言 指令 7BOOAC 和 F70BD3， 回 答 练习 3 中 的 问题 。 


4.2 节 


S 


假定 Pep/8 包含 下 列 4 个 十 六 进 制 值 : 

A: 19AC 

X: FE20 

Mem[0A3F]: FF00 

Mem[0A41]: 103D 

如 果 下 列 每 条 语句 执行 前 是 这 4 个 值 ， 那 么 每 条 语句 执行 后 4 个 十 六 进 制 值 是 什么 ? 
(a)C10A3F (b)D10A3F (c)D90A41 

(d)F10A41 (e)E90A3F (f)790A41 

(g)710A3F (h)910A3F (i)07 


6. 对 下 列 语句 重复 练习 5: 


(a)C90A3F (b)D9OA3F (ec)F10A41 
(d)E10A41 (e)690A3F  (f)710A41 
(g)890A3F (h)990A3F (i) 06 


4.3% 


ds 


确定 下 列 Pep/9 机 器 语言 程序 的 输出 ， 左 边 一 列 是 本 行 第 一 个 字 节 的 内 存 地 址 : 
0000 D10013 

0003 F1FC16 

0006 D10014 

0009 F1FC16 

000C D10015 

000F F1FC16 

0012 00 

0013 4A6F 

0015 79 


0000 DIFC15 
0003 F1001F 
0006 DIFC15 
0009 F10020 
000C D1IFC15 
000F F10021 
0012 D10020 
0015 FIFC16 
0018 D1001F 
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. 如 果 输 入 是 tab， 确 定 下 列 Pep/9 机 器 语言 程序 的 输出 ， 左 边 一 列 是 本 行 第 一 个 字 节 的 内 存 地 址 : 
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001B F1FC16 


001E 00 
9, 确定 下 列 Pep/9 机 器 语言 程序 的 输出 ， 每 部 分 左边 一 列 是 本 行 第 一 个 字 节 的 内 存 地 址 : 
Ca) (b) 
0000 C1LOOOA 0000 C10008 
0003 81000C 0003 06 
0006 F1FC16 0004 F1FC16 
0009 00 0007 00 
OOOA A94F 0008 FOD4 
000C FFFD 
4.455 


10. 假定 需要 处 理 Pep/9 内 存 中 的 31 000 个 整数 ， 每 个 整数 占用 一 个 字 。 一 个 典型 的 程序 中 估计 有 
20% 的 指令 是 一 元 指令 ， 那 么 在 这 个 处 理 数 据 的 程序 中 最 多 能 有 多 少 条 指令 ? 要 记 住 应 用 程序 是 
与 操作 系统 和 数据 共享 内 存 的 。 

编程 题 

4.4 节 

11. 写 一 个 在 输出 设备 上 输出 你 名 字 的 机 器 语言 程序 ， 要 求 名 字 的 长 度 多 于 两 个 字符 ， 它 的 格式 要 适合 
Pep/9 模拟 器 的 装载 器 并 能 够 在 上 面 执行 。 

12. 写 一 个 在 输出 设备 上 输出 4 个 字符 Frog 的 机 器 语言 程序 ， 它 的 格式 要 适合 Pep/9 模拟 器 的 装载 器 
并 能 够 在 上 面 执行 。 

13. 写 一 个 在 输出 设备 上 输出 3 个 字符 Cat 的 机 器 语言 程序 ， 它 的 格式 要 适合 Pep/9 模拟 器 的 装载 器 并 
能 够 在 上 面 执行 。 

14. 写 一 个 把 3 个 数 2、-3 和 6 相 加 的 机 器 语言 程序 ， 在 输出 设备 上 输出 和 。 以 十 六 进 制 存 储 -3。 不 
要 使 用 减法 、 取 反 或 反 转 指令 。 程 序 的 格式 要 适合 Pep/9 模拟 器 的 装载 器 并 能 够 在 上 面 执行 。 

15. 写 一 个 输入 2 个 1 位 数 ， 把 它们 相 加 ， 并 输出 1 个 1 位 数 和 。 输 入 两 个 1 位 数 时 ， 它们 之 间 不 能 有 
空格 。 程 序 的 格式 要 适合 Pep/9 模拟 器 的 装载 器 并 能 够 在 上 面 执行 。 

16. 以 十 六 进 制 格式 编写 图 4-35 的 程序 用 来 输入 到 装载 器 。 用 up 作为 输入 ， 在 Pep/9 模 拟 器 上 
运行 程序 ， 验 证 它 可 以 正确 地 工作 。 然 后 修改 字 节 存储 指令 和 字 节 装 和 指令， 把 结果 存储 在 
Mem[FCAA]， 再 从 Mem[FCAA] 输出 字符 ， 输 出 是 什么 ?请 解释 。 
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ISA3 层 的 语言 是 机 器 语言 ， 是 1 和 0 的 序列 ， 有 时 简写 为 十 六 进 制 的 格式 。 计 算 机 的 
先驱 不 得 不 使 用 机 器 语言 编程 ， 但 是 很 快 他 们 就 开始 厌恶 这 种 很 土 的 方式 。 为 了 编写 二 进 制 
程序 ， 就 需要 记 住 机 器 的 操作 码 ， 且 不 得 不 频繁 地 查 ASCI 表 和 十 六 进 制 表 ， 这 些 都 毫 无 
趣味 。 发 明 汇 编 层 就 是 为 了 让 程序 员 能 免 于 二 进 制 编 程 的 单调 乏味 。 

第 4 章 讲述 ISA3 层 ， 也 就 是 机 器 层 的 Pep/9 计算 机 。 本 章 将 讲述 Asmb5 层 ， 也 就 是 汇 
编 层 的 Pep/9。 这 两 层 之 间 是 操作 系统 。 记 住 抽象 分 层 的 目的 是 隐藏 系统 在 更 低层 次 的 细节 。 
本 章 曾 述 信 息 隐藏 原理 ， 你 可 以 使 用 操作 系统 的 陷阱 处 理 程序 而 不 需 知 道 它 的 操作 细节 ， 即 
你 将 了 解 到 陷阱 处 理 程序 做 什么 而 不 需 知道 它 是 怎样 做 的 。 我 们 在 第 8 章 讲述 陷阱 处 理 程序 
的 内 部 工作 原理 。 


5.1 汇编 程序 


Asmb5 层 的 语言 叫 作 汇编 语言 ， 它 提供 了 一 种 比 二 进 制 更 加 方便 的 编写 机 器 语言 程序 
的 方法 。 图 4-33 的 程序 输出 Hi， 包 含 两 类 位 模式 ， 一 种 是 程序 ， 一 种 是 数据 。 汉 “' 诺 依 曼 
设计 原理 直接 导致 这 两 种 类 型 的 产生 ， 因 为 程序 和 数据 共享 内 存 ， 每 种 都 需要 一 种 二 进 制 
表示 。 

汇编 语言 包含 两 种 类 型 的 语句 ， 分 别 对 应 这 两 种 类 型 的 位 模式 。 助 记 符 语句 对 应 指令 位 
模式 ， 伪 操作 对 应 数据 位 模式 。 


5.1.1 指令 助 记 符 

假定 内 存 中 某 个 位 置 有 机 器 语言 指令 

COOOSA 
它 是 装 入 寄存 器 r 指 令 。 寄 存 器 r 位 为 0， 表 示 是 累加 器 而 不 是 变 址 寄存 器 ， 寻 址 aaa 字段 
是 000， 表 明 是 立即 数 寻 址 。 

这 条 指令 用 Pep/9 汇编 语言 来 写 是 

LDWA 0x009A,i 


助 记 符 LDWA 表示 将 字 装 入 累加 器 ， 用 以 代替 操作 码 1100 和 寄存 器 T 字 段 0。 助 记 符 是 辅 
助 记 忆 的 工具 。 记 住 LDWA 代表 装 和 人 累加 器 指令 要 比 记 住 操作 码 1100 和 寄存 器 r 为 0 代表 
装 人 累加 器 指令 更 为 容易 。 操 作 数 指示 符 以 十 六 进 制 形式 书写 ， 为 009A， 前 面 加 0x， 表 示 
是 十 六 进 制 常量 。 在 Pep/9 汇编 语言 中 ， 通 过 在 操作 数 指 示 符 后 放 一 个 或 多 个 字母 来 指定 
寻 址 方式 ， 字 母 和 操作 数 指示 符 之 间 以 逗号 分 隔 。 图 5-1 展示 了 与 8 种 寻 址 方式 相对 应 的 
字母 。 






立即 数 
001 直接 
010 间接 
011 栈 相 对 

图 5-1 
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E 


i 100 栈 相对 间接 sf 
d 101 变 址 x 

n 110 栈 变 址 SX 
s 111 栈 间接 变 址 sf 


Pep/9 汇编 语言 中 指定 寻 址 方式 的 字母 


这 里 有 一 些 例子 ， 是 用 二 进 制 机 器 语言 和 汇编 语言 编写 的 字 装 人 寄存 器 r 指 


令 。LDWX 对 应 和 LDWA 一 样 的 机 器 


是 0。 


1100 0011 0000 0000 
1100 0110 0000 0000 
1100 1011 0000 0000 
1100 1110 0000 0000 


1001 1010 
1001 1010 
1001 1010 
1001 1010 


语言 语句 ， 除 了 对 LDWX 来 说 ， 寄 存 器 T 位 为 1 而 不 


LDWA 0x009A,s 
LDWA 0x009A, sx 
LDWX 0x009A,s 
LDWX 0x009A,sx 


图 5-2 总 结 了 在 Asmb5 层 Pep/9 指令 集 的 40 条 指令 ， 它 给 出 了 每 个 操作 码 对 应 的 助 记 
符 以 及 指令 的 含义 。 寻 址 方式 列 说 明 人 允许 哪些 寻 址 方式 或 者 指令 是 否 是 一 元 指令 (U)， 状 态 


位 列 说 明 指 令 执行 会 影响 的 状态 位 。 









| 
ra 


0000 0000 
0000 0001 
0000 0010 
0000 0011 
0000 0100 
0000 0101 
0000 011r 
0000 100r 
0000 101r 
0000 110r 
0000 111r- 
0001 000r 
0001 001a 
0001 010a 
0001 Olla 
0001 100a 
0001 101a 
0001 110a 
0001 Illa 
0010 000a 
0010 001a 
0010 010a 
0010 O11n 


STOP 
RET 
RETTR 
MOVSPA 
MOVFLGA 
MOVAFLG 
NOTr 
NEGr 
ASLr 
ASRr 
ROLY 
RORr 
BR 
BRLE 
BRLT 
BREQ 
BRNE 
BRGE 
BRGT 
BRV 
BRC 
CALL 
NOPn 


停止 执行 
从 CALL 返回 

从 陷阱 返回 

把 SP 传送 到 A 

把 NZVC 标志 传送 到 A ( 12..15 ) 
把 A (12..15 ) 传送 到 NZVC 标志 
按 位 反 转 r 

对 r 取 反 

GRAB r 

算术 右 移 r 

循环 左 移 r 

循环 右 移 r 

无 条 件 分 支 

小 于 等 于 分 支 

小 于 分 支 

SFA 

不 等 于 分 支 

大 于 等 于 分 支 

KFA 

如 果 V 为 1， 则 分 支 

如 果 C 为 1， 则 分 支 

调用 子 例 程 

一 元 空 操作 陷阱 


eaqaccecacacaac at 


图 5-2 Asmb5 层 上 的 Pep/9 指令 集 
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0010 laaa Roca BRERA BE i 
00110aaa 。 DECI «= HERI ARABR d,n,s, sfx, sx,sfk NZV 
0011 laaa DECO 十 进 制 输出 陷阱 — i, d, n, s, sf, x, sx, sfx 
0100 0aaa 。 HEXO 十 六 进 制 输出 陷阱 i, d, n, s, sf, x, sx, sfx 














0100 laaa STRO PRE HE dns, sfx 
0101 0aaa ss ADDSP 加 到 栈 指针 (SP) 上 i, d, n, s, sf, x, sx, sfx NZVC 
0101 laaa SUBSP 从 栈 指针 (SP) 减 去 i, d, n, s, sf, x, sx, sfx NZVC 
0110raaa ADDr 加 到 r 上 bn wh si. NZVC 
Olllraaa SUBr 从 Ir 减 去 VC 
jo00raag anor 与 7 技 做 AND Lims xos NZ 
1001 raaa ~ ORr 与 r 按 位 OR id m 8, sf, x sx, six ,NZ 
1010 raaa CPWr 与 + 进行 字 比 较 i, d, n, s, sf, x, sx, sfx NZVC 
1011 raaa CPBr 与 7 (8.15) 进行 字 节 比较 i, d, n, s, sf, x, sx, sfx NZVC 
1100raaa LDWr 从 主 存 装 人 字 到 r i, d, n, s, sf x, sx, sfx NZ 
1101 raaa LDBr 从 主 存 装 人 字 节 到 r(8..15 ) i, d, n, s, sf, x, sx, sfx NZ 
lll0raaa STWr 从 fr 存 储 字 到 主 存 d, n, s, sf, x, sx, sfx 
1111 raaa STBr 从 r (8..15 ) 存储 字 节 到 主 存 d, n, s, sf, x, sx, sfx 

图 5-2 (48) 


图 5-2 还 给 出 了 6 条 新 指令 用 于 代替 未 实现 操作 码 的 指令 : 

NOPn 一 元 空 操作 陷 队 

NOP 非 一 元 空 操 作 陷 阱 

DECI 十 进 制 输入 陷阱 

DECO 十 进 制 输出 陷阱 

HEXO 十 六 进 制 输出 陷阱 

STRO 字符 串 输出 陷阱 

这 些 新 指令 对 Asmb5 层 的 汇编 语言 程序 员 是 可 用 的 ， 但 不 是 ISA3 层 指 令 集 的 一 部 分 。 
OS4 层 的 操作 系统 会 向 它们 提供 陷阱 处 理 程序 。 在 汇编 屋 ， 你 可 以 用 它们 来 编程 ， 仿 佛 它们 
就 是 ISA3 层 指令 集 的 一 部 分 ， 尽 管 实 际 上 它们 并 不 是 。 第 8 章 会 详细 介绍 操作 系统 是 怎样 
提供 这 些 指令 的 。 不 过 用 它们 进行 编程 ， 并 不 需要 知道 实现 它们 的 细节 。 


5.1.2 ” 伪 操 作 


伪 操 作 ( pseudo-ops) 是 汇编 语言 语句 ， 它 没有 操作 码 ， 不 对 应 Pep/9 指令 集 40 条 指令 
中 的 任何 一 条 。Pep/9 汇编 语言 有 9 个 伪 操 作 : 


.ADDRSS 符号 的 地 址 

.ALIGN 填充 以 对 齐 内 存 边 界 
.ASCII ASCI 字 节 字符 串 
.BLOCK RF WIR 

.BURN 初始 ROM 烧 入 


.BYTE 一 个 字 节 值 
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.END 汇编 器 标记 
.EQUATE 将 一 个 符号 等 同 于 一 个 常量 值 
.WORD 一 个 字 值 


除了 .BURN、.END 和 .EQUATE 外 ， 所 有 的 伪 操 作 都 把 数据 位 插入 机 器 语言 程序 中 。 
“ 伪 ” 的 意思 是 假 ， 称 它们 为 伪 操 作 是 因为 它们 产生 的 位 不 对 应 操作 码 ， 不 像 那 40 个 指 
令 助 记 符 产生 的 位 那样 ， 它 们 不 是 真正 的 指令 操作 。 伪 操作 也 叫 作 汇编 器 指示 (assembler 
directive)， 或 者 叫 作 点 命令 (dot command)， 因 为 汇编 语言 中 这 些 指令 前 都 有 个 点 (.)。 

接 下 来 的 3 个 程序 展示 怎样 使 用 .ASCII、.BLOCK 、.BYTE、.END 和 .WORD 伪 操 作 ， 
其 他 伪 操 作 后 面 讲述 。 


5.1.3 .ASCII 和 .END 伪 操 作 


图 5-3 是 用 汇编 语言 而 不 是 机 器 语言 写 的 图 4-33 中 的 程序 。 与 C 不 同 ，Pep/9 汇编 语言 
是 面向 行 的 ， 即 每 条 汇编 语言 语句 必须 包含 在 一 行内 ， 不 能 把 一 条 语句 持续 到 下 一 行 ， 也 不 
能 把 两 条 语句 放 在 同一 行 中 。 


汇编 器 输入 

;Stan Warford 

;May 1, 2017 

;A program to output "Hi" 


LDBA 0x000D,d ;Load byte accumulator 'H' 

STBA OxFC16,d ;Store byte accumulator output device 
LDBA Ox000E,d ;Load byte accumulator 'i' 

STBA OxFC16,d ;Store byte accumulator output device 
STOP ;Stop 


- ASCII “Hin ;ASCII "Hi" characters 
. END 


汇编 器 输出 


Di 00 OD F1 FC 16 Di 00 OE F1 FC 16 00 48 69 zz 


程序 输出 
Hi 





图 5-3 图 4-33 程序 的 汇编 语言 版 : 输出 Hi 


注释 以 分 号 ; 开始 ， 一 直到 本 行 末 端 。 在 一 行 中 只 有 注释 是 允许 的 ， 但 它 必 须 以 分 号 开 
始 。 这 个 程序 的 前 4 行 都 是 注释 行 ， 后 面 的 行 也 包含 注释 ， 不 过 是 跟 在 汇编 语言 语句 的 后 
面 。 和 C 一 样 ， 汇 编 语言 程序 中 至 少 应 该 包含 名 字 、 日 期 和 程序 的 描述 。 不 过 本 书 为 了 他 
约 篇 幅 ， 下 面 的 程序 不 包含 这 样 的 程序 头 。 

LDBA 是 字 节 装 和 人 累加 器 指令 的 助 记 符 ，STBA 是 字 节 存储 累加 器 指令 的 助 记 符 。 语 名 


LDBA 0x000D,d 


表示 “用 直接 寻 址 方式 从 Mem[000D] 装 人 一 个 字 节 ”。 

ASCI 伪 操 作 生 成 连续 的 ASCH 字符 字 节 。 在 汇编 语言 中 ， 可 以 简单 地 写 .ASCII， 然 
后 在 后 面 跟 双 引 号 括 起 来 的 一 个 ASCII 字符 串 。 若 字符 串 中 包含 双 引 号 ， 那 么 必须 在 它 前 
面 加 一 个 反 斜 杠 \， 若 包含 反 斜 枉 ， 就 要 在 它 的 前 面 再 加 一 个 反 斜 枉 。 在 nm 前 面 加 反 斜 杠 可 


154 POE LBA (FIA) 


以 在 字符 串 中 插入 一 个 换行 符 ， 在 t 前 面 加 反 斜 杠 将 在 字符 串 中 插入 一 个 制 表 符 。 
GED 这 是 一 个 包含 两 个 双 引 号 的 字符 串 : 
"She said, \"Hello\"." 
这 是 一 个 包含 反 斜 杠 符 的 字符 串 : 
"My bash is \\." 
这 是 一 个 有 换行 符 的 字符 串 : 
"\nThis sentence will output on a new line." uu 


使 用 \x HE, SEAR ACER AT DL EE, EEL wi, EA 
器 会 预期 接 下 来 的 两 个 字符 是 十 六 进 制 数字 ， 指 定 了 你 想 包含 在 字符 串 中 的 字 节 。 
GED 点 命令 


,RARSCII "Hello\nworld." 
和 

.RSCII "Hello\x0Aworld\x2E" 
生成 同样 的 字 节 序列 ， 即 

48 65 6C 6C 6F OA 77 6F 72 6C 64 2E a 

汇编 语言 程序 必须 以 .END 命令 结束 。 它 不 会 像 ASCI 命令 那样 在 程序 中 搬入 数据 
位 ， 它 仅 表示 汇编 语言 程序 的 结束 。 汇 编 器 用 END 作为 标记 符号 ， 以 便 知道 何 时 应 该 停止 
翻译 。 
5.1.4 汇编 器 

比较 一 下 用 汇编 语言 编写 的 程序 与 用 机 器 语言 编写 的 相同 程序 ， 由 于 在 操作 码 的 位 置 使 
用 了 助 记 符 ， 所 以 汇编 语言 更 容易 理解 ,用 ASCII 字符 直接 写 的 字符 H 和 1i 也 更 易 读 。 

遗憾 的 是 ， 不 能 简单 地 用 汇编 语言 写 一 个 程序 ， 就 指望 计算 机 可 以 理解 它 。 计 算 机 只 能 
通过 执行 冯 ，: 诺 依 曼 运行 周期 ( 取 指 、 译 码 、 增 加 PC. ATT. BR) 来 执行 程序 ， 这 是 固 
化 在 CPU 中 的 。 如 第 4 章 所 述 ， 为 了 执行 周期 能 正确 地 处 理 程序 ， 
它 必 须 以 二 进 制 形 式 存储 在 从 地 址 0000 开始 的 主 存 中 。 因 此 在 装 
入 和 执行 前 ， 汇 编 语言 语句 必须 以 某 种 方式 被 翻译 成 机 器 语言 。 

在 早期 ， 程 序 员 用 汇编 语言 写 程序 ， 然 后 手工 把 每 条 语句 翻译 
成 机 器 语言 。 这 个 翻译 其 实 很 简单 ， 它 只 是 查询 指令 的 二 进 制 操 
作 码 和 在 ASCII 表 中 查询 ASCII 字符 的 二 进 制 编码 。 类 似 地 ， 用 
十 六 进 制 转换 表 把 十 六 进 制 操作 数 转 换 为 二 进 制 格 式 。 只 有 在 翻译 
后 ,程序 才 可 以 装 入 并 执行 。 

翻译 长 程序 是 一 项 无 聊 又 单调 的 工作 。 很 快 程序 员 就 意识 到 可 
以 写 一 个 计算 机 程序 来 做 这 个 翻译 工作 ， 这 样 的 程序 叫 作 汇编 器 ， 
图 5-4 说 明了 它 的 主要 功能 。 

汇编 器 是 这 样 的 一 个 程序 ， 它 输入 汇编 语言 程序 ， 输 出 把 这 个 
程序 翻译 成 适合 装载 器 格式 的 机 器 语言 。 汇 编 器 的 输入 称 为 源 程 图 5-4 汇编 器 的 功能 
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序 ， 输 出 称 为 目标 程序 。 图 5-5 展示 了 Pep/9 汇编 器 处 理 图 5-3 汇编 语言 的 效果 。 


认识 到 汇编 器 只 是 把 程序 翻 
译 成 适合 装载 器 的 格式 是 很 重要 
的 。 它 并 不 执行 程序 ， 翻 译 和 执 
行 是 两 个 分 离 的 过 程 ， 总 是 先进 
行 翻译 。 

因为 汇编 器 本 身 是 一 个 程 
序 ， 所 以 必须 用 某 种 编程 语言 
编写 。 写 出 第 一 批 汇编 器 的 计算 
机 先驱 不 得 不 使 用 机 器 语言 来 纺 
写 。 否 则 ， 如 果 他 们 用 汇编 语言 





图 5-5 Pep/9 汇编 器 对 图 5-3 程序 的 处 理 


来 写 ， 由 于 那 时 还 没有 汇编 器 可 用 ， 他 们 就 不 得 不 手工 再 翻译 成 机 器 语言 。 重 点 是 机 器 只 能 


执行 用 机 器 语言 写 程序 。 


5.1.5 .BLOCK 伪 操 作 


图 5-6 是 图 4-35 中 程序 的 汇 
编 语 言 版 本 。 它 输入 两 个 字符 ， 
按照 相反 的 顺序 输出 它们 。 

从 汇编 器 的 输出 可 以 看 到 第 
一 条 装 人 语句 LDBA OxFC15, d 
翻译 成 了 DIFC15， 最 后 一 条 存 
储 语句 STBA 0xFC16，d 翻译 成 
了 FIFC16， 再 后 面 的 STOP 语 
句 翻 译 成 00。 

.BLOCK 伪 操作 生成 接 下 来 
的 一 个 全 0 字 节 。 点 命令 

-BLOCK 1 
意思 是 “生成 一 个 1 字 节 存储 
块 ” 。 汇 编 器 把 任何 不 以 Ox 开头 
的 数字 解释 为 十 进 制 整数 ， 因 此 


汇编 器 输入 

LDBA OxFC15, 
STBA 0x0013, 
LDBA OxFC15, 
STBA OxFC16, 
LDBA 0x0013, 
STBA OxFC16, 
STOP 

-BLOCK 1 

-END 


汇编 器 输出 

D1 FC 15 F1 00 
FC 16 00 00 zz 
程序 输入 

up 

程序 输出 

pu 


;Input first character 
;Store first character 
;Input second character 
;Output second character 
;Load first character 
;Output first character 
;Stop 

;Storage for first character 


13 Di FC 15 Fl FC 16 Di 00 13 FI 





图 5-6 图 4-35 程序 的 汇编 语言 版 : 输入 两 个 字符 并 逆序 输出 


数字 1 被 解释 为 十 进 制 整数 。 汇 编 器 预期 .BLOCK 后 面 是 一 个 常量 ， 然 后 产生 这 个 数量 字 


节 的 存储 空间 ， 并 把 它们 置 为 0。 


5.1.6 .WORD 和 .BYTE 伪 操作 


图 5-7 和 图 4-36 一 样 ， 计 算 5 加 上 3， 它 说 明 WORD 伪 操 作 的 用 法 。 
和 .BLOCK 命令 一 样 ，.WORD 命令 也 是 为 装载 器 生成 代码 ， 但 是 有 两 点 不 同 。 首 
先 ， .WORD 命令 总 是 生成 一 个 字 (2 字 节 ) 的 代码 ， 不 能 生成 任意 数量 的 字 节 ; 其 次 ， 程 序 


员 能 指定 字 的 内 容 。 点 命令 


-WORD 5 
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的 意思 是 “生成 一 个 值 为 (dec) 的 字 ”。 点 命令 
.WORD 0x0030 


的 意思 是 “生成 一 个 值 为 0030(hex ) 


Ox000D,d ;A <- first number 
Poy 
的 字 ”。 Ox000F,d ;Rdd the two numbers 
BYTE 命 4 All WORD 命 令 0x0011,d ;Convert sum to character 
P as pe : OxFC16,d ;Output the character 
的 工作 方式 一 样 ， 除 了 它 生成 ed 
g ee 四 
字 节 的 值 而 不 是 生成 一 个 字 的 值 。 r 5 ;Decimal 5 
在 这 个 程序 中 ,可 以 把 3 Decimal 3 
0x0030 :Mask for ASCII char 
.WORD 0x0030 1 
替换 为 汇编 器 输出 
.BYTE 0x00 cl 00 OD 61 00 OF 91 00 11 F1 FC 16 00 00 05 00 
.BYTE 0x30 03 00 30 zz 
它 会 生成 同样 的 机 器 语言 。 程序 输出 





可 以 把 这 个 汇编 语言 程序 经 
过 汇编 器 的 输出 和 图 4-36 的 十 六 ” 图 5-7 图 4-36 程序 的 汇编 语言 版 : 计算 5 加 3， 并 输出 单 
进 制 机 器 语言 进行 比较 ， 你 会 发 字符 结果 
现 它们 是 一 样 的。 把 汇编 器 设计 
成 让 它 产 生 的 输出 完全 遵循 装载 器 期 望 的 格式 ， 没 有 前 导 空 行 或 空格 。 字 节 间 只 能 有 1 个 空 
格 ， 每 一 行 的 结尾 都 没有 空格 。 字 节 序 列 以 zz 结束 。 


5.1.7 使 用 Pep/9 汇编 器 

执行 图 5-6 中 的 程序 ， 这 个 逆序 输出 两 个 输入 字符 的 应 用 程序 要 求 在 计算 机 上 运行 
图 5-8 所 示 的 步 又。 

首先 把 汇编 器 装 入 主 存 ， 把 输入 
应 用 程序 作为 输入 文件 ， 此 运行 
的 输出 是 这 个 应 用 程序 的 机 需 语 
言 版 本 ， 接 着 第 二 次 运行 就 把 这 
个 输出 装 人 主 存 。 中 间 两 个 框 里 
的 所 有 程序 必须 是 机 器 语言 写 的 。 

Pep/9 系统 除了 有 汇编 器 之 图 5-8 ”执行 图 5-6 程序 所 需 的 两 次 计算 机 运行 
外 ， 还 有 一 个 模拟 器 。 当 执行 汇 
编 器 时 ， 必 须 提供 给 它 一 个 之 前 用 文本 编辑 器 生成 的 汇编 语言 程序 。 如 果 你 的 程序 没有 错 
ik, 那么 汇编 器 将 生成 适合 装载 器 格式 的 目标 代码 ， 否 则 它 将 给 出 一 条 或 多 条 错误 信息 并 且 
不 会 生成 代码 。 从 一 个 没有 错误 的 程序 生成 代码 后 ， 可 以 用 第 4 章 讲述 的 模拟 器 来 使 用 它 。 

写 汇编 语言 程序 时 ， 助 记 符 或 者 点 命令 后 面 至 少 要 有 一 个 空格 。 除 此 之 外 ， 对 空格 没有 
其 他 限制 。 源 程序 可 以 大 小 写字 母 混用 ， 例 如 图 5-6 中 的 源 程序 可 以 写 为 图 5-9 中 那样 ， 汇 
编程 序 也 会 认为 它 是 有 效 的 ， 接 受 并 生成 正确 的 代码 。 

除了 为 装载 器 生成 目标 代码 外 ， 汇 编 器 生成 程序 代码 列表 。 汇 编 器 代码 列表 把 源 程序 转 
换 成 大 小 写字 母 和 空格 一 致 的 格式 。 图 5-9 中 展示 的 是 无 格式 源 程序 的 汇编 器 代码 列表 。 


输出 


处 理 
汇编 器 应 用 程序 
( 机 器 语言 ) (机 器 语言 ) 
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汇编 器 输入 
ldwa 0x000D,d ;A <- first number 
ADda Ox000F,d ;Add the two numbers 
ORA 0x0011, d ;Convert sum to character 
StBA OXfc16 $ d ;Output the character 
STop ;Stop 
-WORD 5 ;Decimal 5 
-worD 3 ;Decimal 3 
.WORD 0x0030 ;Mask for ASCII char 
.end 


汇编 器 列表 


Operand Comment 


C1000D 0x000D,d ;iB <- first number 
61000F Ox000F,da ;Add the two numbers 
910011 0x0011,d ;Convert sum to character 
F1FC16 OxFC16,d ;Output the character 
;Stop 

5 ;Decimal 5 

3 ;Decimal 3 

0x0030 ¿Mask for ASCII char 





图 5-9 一 个 有 效 的 源 程序 以 及 生成 的 汇编 器 代码 列表 
这 个 代码 列表 也 展示 了 每 一 行 生 成 的 十 六 进 制 目标 代码 ， 以 及 装载 器 会 把 它 装 人 的 第 一 
个 字 节 的 地 址 。 注意 .END 命令 不 会 生成 任何 目标 代码 。 
本 书 接 下 来 的 汇编 语言 程序 都 是 以 汇编 器 代码 列表 的 形式 给 出 的 ， 不 过 不 包括 这 张 图 
里 有 的 、 汇 编 器 生成 的 列 头 部 。 第 二 列 是 机 器 语言 目标 代码 ， 第 一 列 是 装载 器 会 把 代码 装 
和 人 主 存 中 的 地 址 。 这 是 大 多 数 汇编 器 使 用 的 典型 布局 。 这 形象 地 展示 了 ISA3 层 机 器 语言 
Asmbs 层 汇 编 语 言 之 间 的 对 应 关系 。 


5.1.8 ”交叉 汇编 器 

一 个 厂商 生产 的 机 器 通常 具有 和 另 一 个 厂商 生产 的 机 器 不 一 样 的 指令 集 ， 因 此 ， 一 种 品 
牌 计算 机 的 机 器 语言 程序 不 能 在 另 一 种 品牌 的 机 器 上 运行 。 

如 果 用 汇编 语言 给 一 种 个 人 计算 机 写 应 用 程序 ， 通 常 要 在 这 种 计算 机 上 进行 汇编 。 用 该 
汇编 器 所 要 转换 成 的 语言 编写 的 汇编 器 叫 作 常 驻 汇编 器 (resident assembler)。 这 种 汇编 器 和 
应 用 程序 运行 在 同样 的 机 器 上 ， 图 5-8 中 的 汇编 器 和 应 用 程序 就 是 运行 在 同一 台 机 器 上 的 。 

不 过 也 有 可 能 用 X 品牌 机 器 的 机 器 语言 写成 的 汇编 器 把 应 用 程序 翻译 成 男 一 种 Y 品牌 
机 器 的 机 器 语言 。 那 么 这 个 应 用 程序 不 能 在 翻译 它 的 机 器 上 执行 ， 必 须 先 把 它 从 X 品牌 机 
器 移 到 Y 品牌 机 器 上 。 

交叉 汇编 器 生成 的 目标 程序 所 适用 的 机 器 ， 不 同 于 运行 汇编 器 的 机 器 。 把 应 用 程序 
的 机 器 语言 版 本 从 X 品 牌 机 器 的 输出 文件 移 到 YY 品牌 机 器 的 主 存 ， 这 个 过 程 称 作 下 载 
(downloading), X 品牌 机 器 叫 作 宿主 机 ，Y 品牌 机 器 叫 作 目标 机 。 在 图 5-8 中 ， 第 一 次 运行 
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是 在 宿主 机 上 ， 第 二 次 运行 是 在 目标 机 上 。 
这 种 情况 经 常 发 生 在 当 目标 机 器 是 某 种 小 型 特殊 用 途 的 计算 机 时 ， 比 如 移动 设备 或 者 控 
制 微波 炉 豪 饪 周期 的 计算 机 。 汇 编 器 是 需要 大 量 主 存 ， 以 及 输入 /输出 外 围 设备 的 程序 。 控 
制 微波 炉 处 理 器 的 主 存 非常 小 ， 它 的 输入 只 是 控制 面板 上 的 按键 ， 也 许 还 有 来 自 于 温度 探测 
器 的 信号 ， 它 的 输出 包括 数字 显示 和 控制 毫 饪 元 件 的 信号 。 因 为 它 没有 输入 /输出 文件 ， 所 
以 它 不 能 为 自己 运行 汇编 器 。 必 须 有 一 个 更 大 宿主 机 为 它 把 程序 汇编 成 目标 语言 ， 然 后 它 再 
246) 从 宿主 机 上 下 载 该 目标 语言 程序 。 


5.2 ”立即 数 寻 址 和 陷阱 指令 


在 直接 寻 址 方式 中 ， 操 作 数 指示 符 是 操作 数 在 主 存 中 的 地 址 。 数 学 表达 是 

Oprnd = Mem[OprndSpec] 
但 是 在 立即 数 寻 址 方式 中 ， 操 作 数 指示 符 就 是 操作 数 : 

Oprnd = OprndSpec 

采用 直接 寻 址 方式 的 指令 包含 操作 数 的 地 址 ， 而 采用 立即 数 寻 址 方式 的 指令 包含 操作 数 
本 身 。 


5.2.1 立即 数 寻 址 
图 5-10 展示 了 怎样 用 立即 数 寻 址 方式 来 写 图 5-3 中 的 程序 。 这 个 程序 输出 Hi。 
汇编 器 把 装 入 字 节 指令 
LDBA 'H',i 
翻译 成 目标 代码 D00048 (hex)， 即 二 进 制 的 
1101 0000 0000 0000 0100 1000 


查找 图 5-2 SAH 1101 0 是 LDBA 指令 的 操作 码 ; 寻 址 aaa 字段 是 000 (bin), Rave 
立即 数 寻 址 。 如 图 5-1 Aras, i 表示 立 即 数 寻 址 。 

字符 常量 用 单 引号 扩 起 来 ， 它 们 总 是 生成 1 字 节 的 代码 。 在 图 5-10 的 程序 中 ， 字 符 常 
量 放 在 操作 数 指示 符 里 ， 操 作 数 指 
示 符 占用 2 字 节 。 这 种 情况 下 ， 字 


D00048 'H',i ;Output 'H' 
符 常量 位 于 这 2 字 节 中 右边 的 那个 FIFC16 OxFC16,d 
字 节 中 。 D00069 EOP: ;Output 'i' 
汇编 器 就 是 这 样 把 语句 翻译 成 DE EE 


00 


二 进 制 的 。 但 是 当 装载 器 把 程序 装 
人 并 执行 第 一 条 语句 时 会 发 生 什么 
呢 ? 如 果 寻 址 方式 是 直接 寻 址 ， 那 
么 CPU 会 把 0048 作为 地 址 ， 指 示 
主 存 把 Mem[0048] 放 到 总 线 上 以 
便装 人 累加 器 。 由 于 寻 址 方式 是 立 
即 数 寻 址 ， 所 以 CPU 会 把 0048 当 作 操 作 数 本 身 (而 不 是 操作 数 的 地 址 )， 并 把 48 直接 放 入 
Ban 累加 器 ， 而 不 执行 内 存 取 数 。 第 三 条 指令 对 0069 进行 类 似 的 操作 。 
与 直接 寻 址 相 比 ， 立 即 数 寻 址 有 两 个 优点 。 因 为 ASCI 字符 串 和 指令 不 需要 分 开 存 储 ， 





图 5-10 使 用 立即 数 寻 址 的 程序 : 输出 Hi 
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所 以 程序 可 以 更 短 。 图 5-3 中 的 程序 是 15 字 节 ， 而 这 个 程序 是 13 字 节 。 因 为 操作 数 在 指令 
寄存 器 中 ， 对 CPU 来 说 是 立即 可 用 的 ， 所 以 指令 执行 也 更 快 。 若 用 直接 寻 址 方式 ，CPU 必 
须 额外 访问 主 存 以 获取 操作 数 。 


5.2.2 DECI、DECO 和 BR 指令 


截至 目前 我 们 已 经 学 到 的 汇编 语言 特性 相 比 于 机 器 语言 有 了 很 大 的 改进 ， 但 是 仍 有 几 个 
不 尽 如 人 意 的 地 方 - 图 5-11 中 的 程序 说 明了 这 些 地 方 ， 这 个 程序 输入 一 个 十 进 制 的 值 ， 把 
它 加 1， 然后 输出 和 。 


120005 BR 0x0005 ;Branch around data 
0000 .BLOCK 2 ;Storage for one integer 


310003 DECI 0x0003, ;Get the number 
390003 DECO 0x0003, jand output it 
D00020 LDBA 1 ti :Output " + 1 
F1FC16 STBA OxFC16, 
DO002B LDBA aor 
F1FC16 STBA OxFC16, 
D00020 LDBA told 
FIFC16 STBA OxFC16, 
D00031 LDBA 134 id 
F1FC16 STBA OxFC16, 
D00020 LDBA 1 
F1FC16 STBA OxFC16, 
DO003D LDBA =e V 
F1FC16 STBA OxFC16, 
D00020 LDBA Ltd 
F1FC16 STBA OxFC16, 
C10003 LDWA 0x0003, ;五 <- the number 
600001 ADDA Lyk jAdd one to it 
E10003 STWA 0x0003, ;Store the sum 
390003 DECO 0x0003, ;Output the sum 
00 STOP 

. END 


输入 
-479 


输出 


-479 + 1 = -478 





图 5-11 一 个 程序 输入 十 进 制 值 ， 加 1 并 输出 和 
图 5-7 的 第 一 条 指令 


LDWA 0x000D,Q ;A <- first number 


把 Mem[000D] 的 内 容 放 人 累加 器 。 要 写 这 条 指令 ， 程 序 员 必须 知道 第 一 个 数字 要 存储 在 程 
序 指令 部 分 的 后 面 、 地 址 为 000D ( hex) 的 地 方 。 但 把 数据 放 到 程序 末尾 的 问题 是 ， 要 到 写 
完 程序 你 才能 知道 程序 指令 部 分 的 确切 长 度 ， 而 当 写 这 条 需要 数据 地 址 的 指令 时 ， 还 不 知道 
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另 一 个 问题 是 修改 程序 。 假 设想 在 程序 中 插入 一 条 语句 ， 这 样 的 一 个 修改 将 会 改变 数据 
的 地 址 ， 从 而 也 要 修改 每 条 引用 这 些 数据 的 指令 以 反映 新 的 地 址 。 如 果 把 数据 放 在 程序 的 上 
面 ， 对 于 Asmb5 层 程序 来 说 会 更 简单 。 此 时 ， 当 你 写 一 条 引用 数据 的 语句 时 ， 就 已 经 知道 
数据 的 地 址 了 。 

图 5-7 所 示 程 序 的 另 一 个 不 尽 如 人 意 的 地 方 是 ， 由 于 位 于 Mem[FC16] 处 输出 设备 的 限 
制导 致 了 对 结果 只 能 是 单字 符 的 限制 。 因 为 设备 只 能 输出 1 字 节 的 ASCII 字 符 ， 所 以 很 难 
对 ASCII 表示 的 超过 一 个 数字 的 十 进 制 值 执行 IO 操作 。 

图 5-11 中 的 程序 解决 了 这 两 个 问题 。 它 输入 一 个 整数 ， 加 1， 然 后 输出 和 。 数 据 存 储 在 
程序 开始 的 部 分 ， 并 允许 使 用 大 的 十 进 制 值 。 

在 Pep/9 模拟 器 选择 执行 选项 时 ，PC 获得 值 0000 (hex). CPU 会 把 在 Mem[0000] 处 的 
字 节 解释 为 第 一 条 指令 来 执行 。 为 了 把 数据 放 在 程序 的 上 部 ， 我 们 需要 一 条 指令 ， 当 CPU 
获取 下 一 条 指令 时 ， 这 条 指令 会 让 CPU 跳 过 数据 字 节 。 无 条 件 分 支 指令 BR 就 是 这 样 的 指 
令 ， 它 只 是 把 指令 的 操作 数 放 人 PC 中 。 在 这 个 程序 里 ， 


BR 0x0005 ;Branch around data 


把 0005 HA PC。BR 指令 的 RTL 描述 是 

PC +— Oprnd 

在 下 一 个 执行 周期 的 取 指 部 分 ，CPU 会 从 地 址 0005 而 不 是 地 址 0003 获取 指令 ， 如 果 
没有 修改 PC， 就 会 去 0003 处 取 指令 。 

因为 分 支 指令 几乎 总 是 使 用 立即 数 寻 址 方式 ， 所 以 Pep/9 汇编 器 不 要 求 指 定 寻 址 方 
式 。 如 果 对 分 支 指令 不 指定 寻 址 方式 ， 那 么 汇编 需 就 假设 是 立即 数 寻 址 ， 并 为 寻 址 a 字段 生 
成 0。 

BR 指令 的 正确 操作 取决 于 汉 … 诺 依 曼 执 行 周期 的 细节 。 例 如 ， 你 可 能 会 好 奇 ， 为 什 
么 这 个 周期 是 取 指 、 译 码 、 增 加 PC、 执行 和 重复 ， 而 不 是 取 指 、 译 码 、 执 行 、 增 加 PC 和 
重复 。 图 4-34f 展示 了 当 PC 值 为 0003 HT, 执行 指令 D1000D 装 入 字 节 吾 ， 0003 是 指令 
FIFC16 的 地 址 。 如 果 汉 “' 诺 依 曼 执 行 周期 的 执行 部 分 在 增加 PC 部 分 的 前 面 ， 那 么 当 在 地 
HE 0000 的 指令 D1000D 执行 时 ，PC 的 值 为 0000。 相 对 于 正在 执行 指令 之 后 的 指令 而 言 ， 
貌似 PC 对 应 于 正在 执行 的 指令 更 讲 得 通 。 

但 为 何 冯 … 诺 依 曼 执 行 周期 不 把 执行 放 在 增加 PC 的 前 面 呢 ? 这 是 因为 如 果 那 样 ，BR 
就 无 法 正确 工作 了 。 在 图 5-11 中 ,PC 获得 0000, CPU 就 会 获取 BR 指令 120005, BR 执行 ， 
把 0005 HLA PC 中 ,接着 PC 将 增加 到 0008。 此 时 ， 程 序 将 转移 到 0008 而 不 是 0005。 因 为 
指令 集 包 含 分 支 指令 ， 所 以 汉 … 诺 依 曼 执 行 周 期 的 增加 PC 部 分 一 定 要 在 执行 部 分 之 前 。 

DECI 和 DECO 是 两 条 操作 系统 提供 给 汇编 层 的 指令 ，Pep/9 硬件 不 在 机 器 层 提供 这 两 
条 指令 。DECI 代表 十 进 制 输入 ， 它 把 一 个 ASCII 数字 字符 序列 转换 为 一 个 字 ， 对 应 于 该 数 
值 的 补 码 表示 。DECO， 即 十 进 制 输出 ， 做 相反 的 转换 ， 把 一 个 字 长 的 补 码 值 转换 为 ASCII 
字符 序列 。 

DECI 允许 在 输入 中 有 任何 数量 的 前 导 空 格 和 空 行 。 第 一 个 可 打印 的 字符 必须 是 十 进 制 
数字 ,+ 或 者 -， 接 下 来 的 数字 必须 是 十 进 制 数字 。 如 果 输 入 为 0，DECI 把 Z 置 为 1， 如 
果 输 入 为 负 值 ， 它 把 N 置 为 1。 如果 输入 值 超出 范围 ， 它 把 V 置 为 1。 因 为 一 个 字 是 16 位 ， 
2'°=32 768， 所 以 范围 是 -32 768 到 32 767 (dec), DECI 不 影响 C 位 。 
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如 果 值 为 负 ，DECO 输出 一 , 但 是 如 果 值 为 正 , 不 输出 +。 它 不 输出 最 前 面 的 0， 只 输 
出 能 正确 表示 该 数值 的 尽 可 能 少 的 字符 。 不 能 指定 字段 的 宽度 。DECO 不 影响 NZVC 位 。 
在 图 5-11 中 ， 当 面 对 输 入 序列 -479 时 ， 语句 


DECI 0x0003,d ;Get the number 


把 它 转换 为 1111 1110 0010 0001 (bin)， 存 储 在 Mem[0003], DECO 把 二 进 制 序列 转换 为 
ASCII 字符 串 输出 。 


5.2.3 ”STRO 指令 


你 可 能 已 经 注意 到 了 ， 图 5-11 中 的 程序 需要 7 对 LDBA 和 STBA 指令 来 输出 字符 串 
“+1=”， 每 个 输出 的 ASCI 字符 需要 一 对 指令 。 图 5-12 中 的 程序 说 明了 STRO 指令 ， 指 令 
名 字 的 含义 是 字符 串 输 出 。 这 又 是 一 条 在 机 器 层 触发 陷阱 的 汇编 层 真实 指令 ， 它 让 你 只 用 一 
条 指令 就 能 完整 输出 含有 7 个 字符 的 字符 串 。 


120005 BR 0x0005 ;Branch around data 
0000 -BLOCK 2 ;Storage for one integer 


310003 DECI 0x0003, ;Get the number 
390003 DECO 0x0003, ;and output it 
49001B O0x001B, ;Output "+1=" 
C10003 0x0003, ;A <- the number 
600001 1,i ;Add one to it 
E10003 0x0003, ;Store the sum 
390003 0x0003, ;Output the sum 
00 

202B20 A "+ le 

31203D 

2000 





5-12 与 图 5-11 一 样 的 程序 ， 不 过 使 用 的 是 STRO 指令 


STRO 的 操作 数 是 一 个 连续 的 字 节 序列 ， 序 列 中 的 每 个 字 节 都 被 解释 为 一 个 ASCII 字 
符 。 序 列 的 最 后 一 个 字 节 必须 是 全 0，STRO 把 它 解释 为 一 个 标记 符号 。 这 条 指令 从 头 开始 
输出 字 节 字符 串 ， 直 到 但 是 不 包括 标记 符号 。 在 图 5-12 中 ， 伪 操作 


„ASCII " + 1 = \x00" 


FA \x00 生成 这 个 标记 符号 字 节 。 这 个 伪 操 作 生 成 包括 标记 符号 在 内 的 8 字 节 ， 但 是 STRO 
指令 只 输出 7 字 节 。 即 使 可 以 把 .ASCII 伪 操作 放 在 程序 开始 的 地 方 ， 并 绕 开 它 进 行 分 支 ， 
我 们 的 编码 习惯 始终 还 是 把 ASCII 字 符 串 放 在 程序 的 底部 。 
汇编 器 代码 列表 只 在 目标 代码 栏 分 配 了 3 字 节 的 空间 ， 如 果 .ASCII 伪 操作 中 的 字符 串 
生成 的 字 节 数 大 于 3， 那 么 汇编 器 代码 列表 会 在 后 续 的 行 继续 目标 代码 。 
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5.2.4 解释 位 模式 : HEXO 指令 


第 4 章 和 第 5 章 从 低 的 抽象 层次 (ISA3 ) 讲 到 高 的 抽象 层次 (Asmb5 )。 虽 然 Asmb5 层 
的 汇编 语言 隐藏 了 机 器 语言 的 细节 ， 但 细节 仍然 存在 ， 尤 其 是 机 器 最 终 还 是 基于 取 指 、 译 
码 、 增 加 PC、 执 行 、 重 复 这 个 冯 ' 诺 依 曼 执 行 周期 。 用 伪 操 作 和 助 记 符 来 产生 数据 位 和 指 
令 位 不 会 改变 机 器 的 属性 。 当 指令 执行 时 ， 它 只 是 执行 位 ， 并 不 知道 汇编 器 怎样 生成 这 些 
位 。 图 5-13 展示 了 一 个 无 实际 意义 的 程序 ， 它 的 唯一 目的 是 用 来 说 明 这 种 情况 。 它 用 一 种 
伪 操 作 来 产生 数据 位 ， 而 这 些 位 会 被 指令 以 一 种 意 想不到 的 方式 来 解释 。 


120009 0x0009 ;Branch around data 
FFFE 3 OxFFFE ;First 

00 0x00 ;Second 

55 y: ;Third 

0470 1136 ; Fourth 


390003 0x0003,d ;Interpret First as dec 

DOOOOA Ua ot Bree 

F1FC16 OxFC16,d 

390005 0x0005,d ;Interpret Second and Third as dec 
FLFC16 OxFC16,d 

DOOOOA "Nn, 2 

410005 0x0005,d ;Interpret Second and Third as hex 


DOOOOA int, i 

F1FC16 OxFC16,d 

D10006 0x0006,d ;Interpret Third as char 
FLFC16 OxFC16,d 

D10008 0x0008,d ;Interpret Fourth as char 
F1FC16 OxFC16,d 

00 





图 5-13 说明 位 模式 解释 方式 的 无 实际 意义 程序 
在 这 个 程序 中 ,用 
.WORD OxFFFE ;First 
生成 了 First 的 十 六 进 制 值 ， 但 是 被 


DECO 0x0003,d ;Interpret First as dec 
解释 成 一 个 十 进 制 数 ， 并 输出 -2。 当 然 ， 如 果 程 序 员 想 要 把 位 模式 FFFE 解释 为 十 进 制 数 ， 
他 也 许 会 写 这 样 的 伪 操 作 
253 .WORD -2 ;First 
这 个 伪 操 作 生 成 同样 的 目标 代码 ， 而 且 目 标 程序 与 原始 程序 相同 。 当 DECO 执行 时 ， 
它 不 知道 在 翻译 时 位 是 怎样 生成 的 ， 它 只 知道 在 执行 时 它们 是 什么 。 
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十 进 制 输出 指令 
DECO 0x0005,d ;Interpret Second and Third as dec 


把 位 于 地 址 0005 的 位 解释 为 一 个 十 进 制 数 ， 输 出 85。DECO 总 是 输出 两 个 连续 字 节 的 
十 进 制 值 。 这 种 情况 下 ， 字 节 0055 (hex) = 85 (dec)。 实 际 情况 是 这 2 字 节 是 由 两 个 不 
AY BYTE 点 命令 生成 的 ,一 个 是 从 十 六 进 制 常量 0x00 生成 的 ， 而 另 一 个 是 从 字符 常 
E 所 ' 生 成 的 ， 而 这 些 都 没有 关系 。 在 执行 时 ， 唯 一 重要 的 是 位 是 什么 ， 而 不 是 它们 来 自 
哪里 。 

十 六 进 制 输出 指令 


HEXO 0x0005,d ;Interpret Second and Third as hex 


把 从 地 址 0005 开始 的 两 个 字 节 解释 为 4 个 十 六 进 制 数 字 ， 并 以 不 含 空格 的 方式 输出 它们 。 
同样 ， 由 什么 伪 操 作 产生 这 些 位 是 不 重要 的 。 如 果 HEXO 指令 从 地 址 0006 开始 输出 ， 那 么 
输出 的 就 是 5504， 而 不 是 0055。 

指令 对 

LDBA 0x0006,d ;Interpret Third as char 

STBA OxFC16,d 


把 地 址 0006 的 位 解释 为 一 个 字符 。 这 一 点 也 不 奇怪 ， 因 为 这 些 位 是 由 .BYTE 点 命令 用 一 个 
字符 常量 生成 的 。 和 预期 的 一 样 ， 输 出 了 字母 U。 

最 后 一 对 指令 

LDBA 0x0008,d ;Interpret Fourth as char 

STBA OxFC16,d 


输出 字母 p。 为 什么 呢 ? 因为 存储 单元 0008 的 位 是 70 (hex), Ede ASCII 字符 p 对 应 的 位 。 
这 些 位 是 从 哪里 来 的 ? 它们 是 

.WORD 1136 ;Fourth 
生成 位 的 后 半 部 分 。 之 所 以 这 样 是 因为 1136 (dec) = 0470 (hex)， 而 这 个 位 模式 的 第 二 个 字 
节 是 70 (hex)。 

在 所 有 这 些 例子 中 ， 指 令 只 是 经 过 汉 “' 诺 依 曼 执行 周期 。 我 们 必须 牢记 翻译 过 程 不 同 于 
执行 过 程 ， 翻 译 在 执行 之 前 进行 。 翻 译 后 ， 当 指令 执行 时 ， 位 的 来 源 就 不 重要 了 。 唯 一 重要 
的 是 位 是 什么 ， 而 不 是 翻译 阶段 它们 是 从 哪里 来 的 。 


5.2.5 反 汇 编 器 

汇编 器 把 每 条 汇编 语言 语句 都 翻译 成 一 条 机 器 语言 语句 ， 这 样 的 转换 叫 作 一 对 一 映射 
( one-to-one mapping)。 一 条 汇编 语言 语句 映射 到 一 条 机 器 语言 语句 。 这 和 编译 器 不 同 ， 稍 
后 我 们 会 看 到 编译 器 的 一 对 多 映射 。 

给 你 一 条 汇编 语言 语句 ， 总 是 可 以 确定 它 对 应 的 机 器 语言 语 名 。 反 过 来 呢 ? 给 你 一 个 机 
器 语言 程序 的 位 序列 ， 你 能 确定 这 条 机 器 语言 来 自 哪 条 汇编 语言 语句 吗 ? 

答案 是 : 不 ， 你 不 能 。 尽 管 汇编 语言 到 机 器 语言 的 转换 是 一 对 一 的 ， 但 逆向 转换 却 不 是 
唯一 的 。 对 于 二 进 制 机 器 语言 序列 


0101 0111 
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就 无 法 确定 汇编 语言 程序 员 原 来 使 用 的 是 字符 W 的 汇编 器 指示 字 ， 还 是 使 用 栈 间接 变 址 寻 
址 方式 的 ADDSP 助 记 符 。 不 管 源 程序 中 是 这 
两 条 汇编 语言 语句 中 的 哪 一 个 ， 汇 编 器 都 会 生 


As 汇编 语言 程序 
成 完全 一 样 的 位 序列 。 0000 D10013 0x0013, 
此 外 ， 在 执行 时 ， 主 存 不 知道 原始 的 汇编 0003 F1FC16 OxFC16, 
语句 是 什么 ， 它 只 知道 CPU 通过 执行 周期 处 理 0006 D10014 0x0014, 
4 1 #10 0009 OxFC16, 
R oooc 0x0015, 
图 5-14 给 出 了 生成 相同 机 咒语 言 的 两 个 汇 000F OxFC16, 


编 语言 程序 ， 因 此 生成 的 输出 也 一 样 。 当 然 ， 0012 o 
严谨 的 程序 员 不 会 写 出 第 二 个 程序 ， 因 为 它 比 ie Pun 
第 一 个 程序 难 理解 多 了 。 


因为 有 伪 操作 ， 所 以 反 汇 编 映射 不 是 唯一 。 | RE hipaa 
的 。 如 果 没 有 伪 操 作 ， 从 二 进 制 目标 代码 还 原 0003 F1FC16 OxFC16,d 
出 原始 汇编 语言 语句 就 会 只 有 一 种 可 能 的 形式 。 SORO ORME ORTE 
伪 操 作用 来 把 数据 位 ， 而 不 是 指令 位 , 插入 内 | oooe pioo1s hig 
存 中 。 数 据 和 程序 共享 内 存 是 反 汇 编 映射 不 唯 000F F1FC16 OxFC16,d 
一 的 主要 原因 。 qa42 ee 


0013 50756E Ox756E,i 


对 于 软件 开发 者 来 说 ， 从 目标 程序 恢复 源 0016 
程序 很 困难 是 一 个 有 利于 市 场 的 好 处 。 如 果 用 


程序 输出 
汇编 语言 写 了 一 个 应 用 程序 ， 你 有 两 种 方式 销 Pun 





GE: 一 种 是 卖 源 程序 ， 让 客户 对 它 进行 汇编 ， 
那么 客户 就 拥有 源 程序 和 目标 程序 ; 一 种 是 你 
自己 汇编 ， 仅 出 售 目标 程序 。 

采用 这 两 种 方式 ， 客 户 都 有 执行 应 用 程序 
所 必需 的 目标 程序 。 但 是 如 果 客 户 也 有 源 程 序 ， 他 就 可 以 很 容易 地 修改 源 程序 以 适应 他 自己 
的 目的 。 他 甚至 只 需 稍微 费 点 儿 功 夫 就 可 以 改进 这 个 源 程序 ， 把 它 作 为 一 个 增强 版 来 销售 ， 
并 和 你 形成 直接 竞争 。 修 改 机 器 语言 程序 就 会 困难 很 多 。 因 此 为 了 防止 客户 算 改 程序 ， 大 多 
数 商 业 软 件 产品 只 出 售 目标 代码 形式 的 产品 。 

开源 软件 运动 是 计算 机 行业 近来 的 一 个 发 展 。 这 个 理念 是 由 于 支持 的 问题 ， 客 户 拥有 源 
程序 是 有 益 的 。 如 果 只 有 目标 程序 ， 那 么 在 发 现 了 需要 修补 的 漏洞 ， 或 者 发 现 了 一 个 需要 增 
加 的 特性 时 ， 必 须 等 待 卖 给 你 软件 的 公司 修补 漏洞 或 增加 特性 。 如 果 拥 有 源 程 序 ， 就 可 以 自 
已 修改 使 之 适合 你 自己 的 需要 。 有 些 开 源 公 司 确实 免费 提供 源 代 码 ， 通 过 为 产品 提供 软件 支 
持 获得 收入 。 采 用 这 种 策略 的 一 个 例子 是 Linux 操作 系统 ， 它 可 以 免费 从 因特网 获得 。 尽 管 
这 样 的 软件 是 免费 的 ， 但 是 使 用 它 需 要 有 较 高 水 平 的 技能 。 

反 汇 编 器 (disassembler) 是 一 个 试图 从 目标 程序 恢复 源 程序 的 程序 。 因 为 反 向 汇编 器 映 
射 的 非 唯 一 性 ， 所 以 反 汇 编 器 不 一 定 能 百 分 百 成 功 。 本 章 中 的 程序 把 数据 放 在 指令 的 前 面 或 
者 指令 的 后 面 。 在 大 型 程序 中 ， 数 据 部 分 的 放置 通常 会 贯穿 程序 ， 这 就 使 得 在 目标 程序 中 辩 
别 指令 位 和 数据 位 很 困难 。 反 汇编 器 能 够 读 取 每 个 字 节 并 数 次 输出 它 : 一 次 解释 为 指令 指示 
符 , 一 次 解释 为 ASCII 字符 ， 一 次 解释 为 二 进 制 补 码 表示 的 整数 等 。 然 后 ， 人 们 可 以 尝试 
去 重 构 源 程序 ， 但 这 个 过 程 非常 单调 乏味 。 


图 5-14 产生 相同 目标 程序 以 及 相同 输出 的 
两 个 不 同 的 源 程 序 


5.3 符号 

前 面 一 节 介 绍 了 分 支 指令 BR， 用 来 绕 开 程序 开头 的 数据 。 尽 管 这 个 技术 减轻 了 手工 确 
定数 据 单元 地 址 的 问题 ， 但 它 不 能 完全 消除 这 个 问题 。 仍 然 必须 通过 十 六 进 制 计 数 来 确定 这 
些 数据 单元 的 地 址 ， 如 果 数 据 单元 数量 很 大 ， 就 可 能 出 错 。 而 且 ， 如 果 想 修改 数据 部 分 ， 比 
如 删除 一 条 .WORD 命令 ， 这 条 删除 的 指令 后 面 的 所 有 数据 单元 的 地 址 都 将 会 改变 。 这 样 就 
必须 修改 所 有 引用 了 这 些 修改 过 的 地 址 的 指令 。 

汇编 语言 符号 可 以 消除 手工 确定 地 址 的 问题 。 类 似 于 C 的 标识 符 ， 汇 编 器 让 一 个 符号 
(symbol) 和 一 个 内 存 地 址 关联 起 来 。 在 程序 中 任何 需要 引用 这 个 地 址 的 地 方 ， 都 可 以 引用 
这 个 符号 。 如 果 通 过 增加 或 删除 语句 修改 程序 ,那么 当 汇 编 这 个 程序 时 ， 汇 编 器 将 计算 和 这 
个 符号 相关 联 的 新 地 址 ， 这 样 就 不 需要 重 写 通过 符号 引用 了 被 改变 的 地 址 的 语句 。 


5.3.1 带 符 号 的 程序 
5-15 的 汇编 语言 生成 的 目标 代码 和 图 5-12 中 的 一 样 。 它 使 用 了 3 个 符号 ，num、 


msg 和 main. 


Operand Comment 


120005 i ;Branch around data 
0000 2 iStorage for one integer #2d 


310003 - iGet the number 
390003 ? ;and output it 
49001B 2 Output Te 二 
C10003 p ;A <- the number 
600001 RE ;Add one to it 
E10003 , ;Store the sum 
390003 ;Output the sum 
00 

202B20 msg: „ASCII "+1 = \x00" 








图 5-15 一 个 计算 十 进 制 值 加 1 的 程序 。 除 了 使 用 符号 之 外 ， 其 他 的 部 分 与 图 5-12 相同 
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符号 的 语法 规则 类 似 于 C 标识 符 的 语法 规则 ， 第 一 个 字符 必须 是 字母 ， 接 下 来 的 字符 
必须 是 字母 或 数字 。 符 号 的 长 度 最 多 是 8 个 字符 ， 并 且 是 区 分 大 小 写 的 。 例 如 ，Number 和 
number 是 不 同 的 符号 ， 因 为 大 写字 母 N 和 小 写字 母 n 是 不 同 的 。 

可 以 通过 把 它 放 在 任何 一 个 汇编 语言 行 的 前 面 来 定义 一 个 符号 。 当 定义 了 一 个 符号 时 ， 
必须 用 冒号 : 来 结束 ， 最 后 一 个 字符 和 冒号 之 间 不 能 有 空格 。 在 这 个 程序 中 ,语句 


num: .BLOCK 2 ;Storage for one integer #2d 


除了 分 配 了 一 个 2 字 节 的 块 以 外 ， 还 定义 了 一 个 字符 num。 这 一 行 中 ， 冒 号 和 伪 操作 之 
间 有 空格 ,但 是 汇编 器 并 不 要 求 一 定 要 有 空格 。 

当 汇 编 器 检测 到 符号 定义 时 ， 就 会 在 符号 表 中 存储 这 个 符号 和 它 的 值 。 这 个 值 是 内 存 中 
该 行 生成 的 目标 代码 的 第 一 个 字 节 将 要 被 装 人 的 地 址 。 如 果 在 程序 中 定义 了 一 些 符号 ， 那 么 
汇编 器 代码 列表 会 输出 一 个 符号 表 ， 其 中 的 值 以 十 六 进 制 表示 。 图 5-15 展示 了 这 个 程序 的 
符号 表 输 出 。 从 表 中 可 以 看 到 符号 num 的 值 是 0003 (hex). 

当 引 用 符号 时 ， 不 能 包括 冒号 。 语 名 


LDWA num,d ;A <- the number 

引用 了 符号 num. AW num 的 值 是 0003 (hex)， 所 以 这 条 语句 生成 的 代码 和 语句 
LDWA 0x0003,d ;A <- the number 

生成 的 代码 一 样 。 类 似 地 ， 因 为 main 的 值 是 0005 (hex)， 所 以 语句 
BR main ;Branch around data 

生成 的 代码 和 语句 


BR 0x0005 ;Branch around data 


生成 的 代码 是 一 样 的 。 
注意 ， 符 号 的 值 是 地 址 ， 而 不 是 那个 地 址 单元 的 内 容 。 当 程序 执行 时 ，Mem[0003] 将 包 
含 -479 (hex)， 它 取 自 输入 设备 。num 的 值 仍 然 是 0003 (hex), MAE -479， 这 两 者 是 不 
同 的 。 可 以 把 符号 的 值 想象 成 来 自 于 汇编 器 代码 列表 中 包含 该 符号 定义 的 那 一 行 的 地 址 列 。 
符号 不 仅 把 人 们 从 手工 计算 地 址 的 负担 中 解脱 出 来 ， 而 且 也 使 程序 更 易 读 。 在 视觉 上 ， 
num 比 0x0003 更 易 读 。 优 秀 的 程序 员 会 非常 细心 地 为 他 们 的 程序 挑选 有 意义 的 符号 来 增加 
程序 的 可 读 性 。 


5.3.2 ”一 个 冯 “' 诺 依 曼 示 例 


当 在 Asmb5 层 用 符号 编程 时 ， 很 容易 忘记 计算 机 的 冯 : 诺 依 曼 本 质 。 两 个 经 典 的 
1, + 诺 依 曼 漏洞 (把 指令 当 作 数据 操作 和 把 数据 当 作 指令 来 执行 ) 仍然 存在 。 

例如 ， 思 考 下 面 的 汇编 语言 程序 : 

this: DECO this,d 

STOP 

-END 

你 可 能 认为 汇编 嚣 会 拒绝 第 一 条 指令 ， 因 为 它 看 上 去 在 把 它 自己 当 作 数据 进行 引用 ， 这 
貌似 没有 意义 。 但 是 汇编 器 不 会 往 前 看 执行 的 结果 。 因 为 语法 是 正确 的 ， 所 以 它 相 应 地 进行 
翻译 ， 如 图 5-16 的 汇编 器 代码 列表 所 示 。 
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在 执行 期 间 ，CPU 把 39 解释 为 采用 直接 寻 址 的 十 进 制 输出 指令 的 操作 码 ， 把 Mem 


[0000] 的 字 3900 (hex) 解释 为 十 进 制 数字 ， 并 输 
它 的 值 14 952。 

认识 到 计算 机 硬件 没有 天 生 的 智能 也 没有 推 
理 能 力 是 很 重要 的 。 执 行 周期 和 指令 集 固 化 在 
CPU 中 。 就 像 这 个 程序 说 明 的 那样 ，CPU 不 知道 
它 处 理 的 位 历史 ， 它 没有 总 体 图 ， 它 只 是 一 遍 又 
一 遍地 执行 汉 ' 诺 依 曼 循环 。 主 存 也 是 这 样 的 ， 
它 不 知道 它 存储 过 的 位 历史 ， 它 只 是 根据 CPU 的 
命令 存储 1 和 0。 任何 智能 或 推理 能 力 都 来 自 于 软 
件 ， 而 软件 是 人 写 的 。 


mre Saan 


汇编 器 列表 
0000 390000 this: DECO 
0003 00 STOP 


0004 . END 


输出 





图 5-16 一 个 无 实际 意义 的 程序 ， 展示 机 
器 的 底层 冯 ， 诺 依 曼 本 质 
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5.4 从 HOL6 层 翻 译 





编译 器 把 高 级 语言 (HOL6 层 ) 程序 转换 为 较 低级 语言 的 程序 ， 最 终 程序 能 被 机 器 执行 。 
有 些 编译 器 直接 翻译 成 机 器 语言 (ISA3 层 )， 如 图 5-18a 所 示 ， 这 样 程序 就 可 以 装 入 内 存 并 
执行 。 男 一 些 编译 器 翻译 成 汇编 语言 (Asmb5 层 )， 如 图 5-18b 所 示 ， 接 下 来 必须 由 汇编 器 


把 汇编 语言 程序 再 翻译 成 机 器 语言 ， 然 
后 才能 装 入 和 执行 。 

与 汇编 器 一 样 ， 编 译 器 也 是 一 个 程 
序 。 它 必须 像 其 他 程序 一 样 地 编写 和 调 
试 。 编 译 器 的 输入 叫 作 源 程 序 ， 不 管 输 
出 是 机 器 语言 还 是 汇编 语言 都 叫 作 目 标 
程序 。 这 和 汇编 器 的 输入 /输出 术语 是 
一 样 的 。 

本 节 讲 述 从 C 到 Pep/9 汇 编 语 言 
的 翻译 过 程 。 它 展示 编译 器 怎样 翻译 
scanf(), printfO 和 赋值 语句 ， 以 及 它 是 
怎样 在 C 层 实施 类 型 (type) 的 概念 。 
第 6 章 将 继续 讨论 高 级 语言 层 (HOL6 








a) 直接 翻译 为 机 器 语言 b ) 翻译 为 汇编 语言 
图 5-18 编译 器 的 功能 
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B) 和 汇编 语言 层 (Asmb5 层 ) 之 间 的 关系 。 
5.4.1 Printf() 函数 


图 5-19 中 的 程序 展示 了 编译 器 怎样 把 一 个 简单 的 、 只 有 一 条 输出 语句 的 C 程序 翻译 成 
汇编 语言 。 
高 级 语言 


#include <stdio.h> 

int main() { 
printf ("Hello, world!\n") ; 
return 0; 


} 


汇编 语言 
0000 490004 STRO msg, d 
0003 00 STOP 
0004 48656C msg: .ASCII "Hello, world!\n\x00" 
6C6F2C 
20776F 
726C64 
210A00 





Hello, world! 


图 5-19 HOL6 层 和 AsmbS 层 的 printf() 函数 
编译 器 把 一 条 C 语句 
printf ("Hello, world!\n"); 
翻译 为 一 条 可 执行 的 汇编 语句 
STRO msg,d 


和 一 个 点 命令 


msg: .ASCII "Hello, world!\n\x00" 

这 是 一 个 一 对 二 的 映射 。 与 汇编 器 相 比 ， 编 译 器 的 映射 通常 不 是 一 对 一 的 ， 而 是 一 对 多 
的 。 这 个 程序 和 后 面 的 所 有 程序 都 把 字符 串 常量 放 在 程序 的 底部 。 对 应 于 变量 值 的 数据 放 在 
程序 的 项 部 ， 对 应 于 它们 在 HOL6 程序 中 的 放置 位 置 。 

编译 器 把 C 语句 

return 0; 
翻译 为 汇编 语言 语句 

STOP 

除了 main) 之 外 ，C 函数 的 return 语句 不 翻译 为 STOP。 这 个 对 main() 的 return 的 翻译 
是 一 个 简化 。 实 际 的 C 编译 器 必须 生成 在 特定 操作 系统 上 执行 的 代码 。 由 操作 系统 来 解释 “|263 


main() 函数 的 返回 值 。 通 常 的 愤 例 是 返回 值 0 表示 程序 的 执行 没有 发 生 错 误 ; 如 果 发 生 了 错 |264 
误 ， 程 序 返 回 某 个 非 零 值 ， 但 是 这 种 情况 下 会 发 生 什么 取决 于 具体 的 操作 系统 。 在 Pep/9 系 
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统 中 ， 从 main) 的 返回 对 应 于 终止 程序 ， 因 此 从 main() 返回 将 总 是 被 翻译 成 STOP。 第 6 
章 将 展示 编译 器 怎样 翻译 main() 之 外 的 其 他 函数 的 return. 
C 程序 的 其 他 部 分 甚至 直接 不 翻译 。 例 如 ， 


#include <stdio.h> 


根本 不 会 在 汇编 语言 程序 中 出 现 。 实 际 的 C 编译 器 会 用 # include 语句 生成 到 操作 系统 及 其 
库 的 正确 接口 。 因 为 这 里 我 们 只 做 简单 的 介绍 ， 所 以 Pep/9 系统 会 忽略 这 种 细节 。 

图 5-20 展示 了 编译 这 个 程序 的 编译 器 的 输入 和 输出 。 图 5-20a 部 分 是 直接 翻译 为 机 器 
语言 的 编译 器 ， 目 标 程序 可 以 装 人 和 执行 。 图 5-20b 部 分 是 翻译 为 Asmb5 层 汇编 语言 的 编 
译 器 ， 在 装 入 和 执行 前 ， 还 需要 汇编 为 目标 程序 。 

输入 处 理 输出 
#include <stdio.h> 00 04 
int main() { 


printf("Hello, world!\n") ; 65 6C 6C 6F 2C 20 
return 0; 6F 72 6C 64 21 OA 00 


} 





a) 直接 翻译 为 机 器 语言 的 编译 器 














#include <stdio.h> 
int main() { 

printf ("Hello, world!\n") ; 
return 0; 





STRO 
STOP 
msg: .ASCII "Hello, world!\n\x00" 
. END 


msg,d 






b) 翻译 为 汇编 语言 的 编译 器 
图 5-20 编译 器 对 图 5-19 中 的 程序 所 做 的 行为 


5.4.2 ”变量 和 类 型 

每 个 C 变量 有 3 个 属性 : 变量 名 、 变 量 类 型 和 变量 值 。 对 每 个 声明 的 变量 ， 编 译 器 在 机 
器 语言 程序 中 会 保留 一 个 或 多 个 内 存单 元 。 高 级 语言 中 的 变量 在 低级 语言 中 就 只 是 一 个 内 存 
单元 。HOL6 层 程序 通过 和 名字 ( 即 C 标识 符 ) 引用 变量 ， 而 ISA3 层 程 序 通过 地 址 引用 它们 。 
变量 值 是 与 C 标识 符 相 关联 的 地 址 处 的 内 存单 元 的 值 。 

编译 器 必须 记 住 哪个 地 址 对 应 HOL6 层 程序 中 的 哪个 变量 名 ， 它 用 一 个 符号 表 来 建立 变 
量 名 和 地 址 之 间 的 关联 。 

编译 器 的 符号 表 类 似 于 汇编 程序 的 符号 表 ， 但 是 内 在 要 复杂 得 多 。C 中 的 变量 名 没有 限 
制 为 最 多 8 个 字符 ， 而 Pep/9 中 的 符号 有 这 个 限制 。 此 外 ， 编 译 器 的 符号 表 必 须要 存储 变量 
类 型 以 及 它 的 关联 地 址 。 

直接 翻译 为 机 器 语言 的 编译 器 不 需要 用 汇编 器 进行 二 次 翻译 。 图 5-21a 展示 了 这 样 一 个 
编译 器 的 符号 表 产 生 的 映射 。 不 过 ， 本 书 中 的 程序 说 明了 一 个 翻译 为 汇编 语言 的 、 假 设 的 编 
译 器 的 翻译 过 程 ， 因 为 汇编 语言 比 机 器 语言 更 易 读 。C 变量 名 对 应 于 Pep/9 汇编 语言 的 符号 ， 
如 图 5-21b 所 示 。 

5-21b 中 的 对 应 关系 ， 对 于 翻译 为 汇编 语言 的 编译 器 来 说 是 不 太 实际 的 。 设 想 一 个 有 
两 个 变量 discountRatel 和 discountRate2 的 C 程序 ， 因 为 这 两 个 变量 的 长 度 都 大 于 8 个 字 
符 ， 所 以 编译 器 很 难 把 这 两 个 标识 符 映射 到 各 自 唯 一 的 Pep/9 符号 。 为 了 使 C 和 汇编 语言 
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间 的 对 应 关系 清晰 ， 我 们 的 例子 会 把 C 标识 符 限制 为 最 多 8 个 字符 。 真 实 的 、 翻 译 到 汇编 
变量 名 的 


语言 的 编译 融通 常 不 会 对 变量 名 使 用 汇编 语言 符号 。 
Pep/9 内 存 
C 标 识 符 C 标识 符 汇编 语言 符号 地 址 
a) 翻译 为 机 器 语言 的 编译 器 b) 为 了 演示 而 假设 的 编译 器 
图 5-21 编译 器 在 HOL6 层 变 量 和 1SA3 层 内 存 位 置 之 间 所 做 的 映射 






变量 名 的 





5.4.3 全 局 变量 和 赋值 语句 


图 5-22 中 的 C 程序 来 自 图 2-4。 它 给 出 了 HOL6 层 的 全 局 变量 的 赋值 语句 和 由 编译 器 
产生 的 相应 的 汇编 语言 程序 。 这 里 的 目标 程序 包含 注释 ， 但 是 实际 的 编译 器 不 会 产生 注释 ， 
因为 人 类 程序 员 通 常 不 需要 读 目 标 程序 。 


高 级 语言 

#include <stdio.h> 

char ch; 

int j; 

int main() { 

scanf ("%c $d", &ch, &j); 
5 


i 


print£("%c\n%d\n", ch, j); 
return 0; 


} 

汇编 语言 

0000 120006 

0003 00 $ ;global variable #1c 
0004 0000 j: ;global variable #2d 


0006 D1iFC15 chariIn,d scanf ("tc da", &ch, &j) 
0009 F10003 ch,d 

000C 310004 ja 

000F C10004 3,4 

0012 600005 5,2 

0015 E10004 Jad 

0018 D10003 ch,d 

001B 600001 1i 

001E F10003 ch,d 

0021 D10003 ch,d jprintf("%c\nsd\n", ch, j) 
0024 FlFC16 charOut,d 

0027 DOOOOA hn’, a 

002A F1FC16 charOut,d 

002D 390004 4,4 

0030 DOOOOA Net ,出 

0033 F1FC16 charOut,d 

0036 00 

0037 





图 5-22 HOL6 层 和 Asmbs 层 的 全 局 变量 赋值 语句 。 该 C 程序 来 自 图 2-4 
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图 5-22 ( 续 ) 


汇编 语言 代码 列表 表明 有 两 个 符号 虽然 被 使 用 了 ， 但 是 却 明 显 没 有 进行 定义 : 与 LDBA 
指令 一 起 使 用 的 charIn， 与 STBA 指令 一 起 使 用 的 charOut。 汇 编 器 自动 把 这 两 个 符号 包含 
到 它 的 符号 表 中 ， 程 序 员 不 需要 显 式 地 定义 它们 。 图 4-41 的 Pep/9 计算 机 内 存 映射 展示 了 
操作 系统 内 位 于 Mem[FC15] 的 输入 设备 ， 和 位 于 Mem[FC16] 的 输出 设备 。 第 8 章 描述 了 
Pep/9 操作 系统 ， 图 8-2 显示 charIn 和 charOut 是 在 操作 系统 汇编 语言 程序 中 定义 的 。 
如 果 修 改 了 操作 系统 ， 则 输入 设备 可 能 不 再 存在 于 Mem[FC15]。 但 是 它 的 位 置 仍然 在 
位 于 FFF8 的 机 器 向 量 中 。 同 样 ， 输 出 设备 的 位 置 也 始终 在 位 于 FFFA 的 机 器 向 量 中 。 汇 编 
器 从 操作 系统 的 符号 表 中 获取 charin 和 charOut 的 值 ， 该 符号 表 依 次 设置 下 列 机 器 向 量 : 
Mem[FFF8] 为 charIn 的 值 
Mem[FFFA] 为 charOut 的 值 
执行 时 ， 虚 拟 机 利用 这 些 向 量 来 获取 输入 和 输出 设备 在 内 存 映 射 中 的 位 置 。 从 现在 开 
始 ,在 访问 内 存 映 射 的 IO 设备 时 应 使 用 符号 charin 和 charOut， 因 为 ,不管 如 何 修 改 操作 
系统 ， 它 们 始终 都 会 映射 到 正确 的 内 存 位 置 。 
记 住 编译 器 是 一 个 程序 ， 它 必须 像 其 他 程序 一 样 进行 编写 和 调试 。 一 个 翻译 C 程序 的 
编译 器 可 以 用 任何 语言 来 编写 ， 甚 至 是 C! 下 面 的 程序 片段 说 明了 这 个 交错 的 状态 。 它 是 把 
C 源 程序 翻译 成 汇编 语言 目标 程序 的 简化 编译 咒 的 一 部 分 。 
typedef int HexDigit; 
enum KindType {sInt, sBool, sChar, sFloat}; 
struct SymbolTableEntry { 
char symbol [32] ; 
HexDigit value [4] ; 
KindType kind; 

}; 


SymbolTableEntry symbolTable[100]; 

符号 表 中 的 一 个 表 项 包含 三 部 分 : 符号 本 身 ; 它 的 值 ， 即 Pep/9 内 存 中 存储 变量 值 的 地 
址 ; 存储 的 值 的 种 类 ， 即 变量 的 类 型 。 

图 5-23 展示 了 这 个 程序 符号 表 中 的 表 项 。 


第 一 个 变量 的 符号 名 是 ch， 编 译 器 通过 生 ee 
成 .BLOCK 命 令 在 Mem[0003] 分 配 1 T 节 , [1] j 0004 sint 
在 符号 表 中 把 它 的 类 型 存储 为 SChar， 表 明 这 D] 


个 变量 是 一 个 C 字符 。 第 二 个 变量 的 符号 名 
是 j， 编 译 器 为 这 个 值 在 Mem[0004] 处 分 配 2 
字 节 ， 把 它 的 类 型 存储 为 sInt， 表 明 是 一 个 C 
整 型 。 编 译 器 从 C 程序 的 变量 声明 得 出 变量 类 型 。 


图 5-23 ”翻译 图 5-22 程序 的 假设 编译 器 符号 表 
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Wh 


在 代码 生成 阶段 ， 编 译 器 把 

scanf (wsc gd", &ch, &j); 
翻译 为 

LDBA OxFC15,d 


STBA 0x0003,d 
DECI 0x0004,d 


编译 的 前 一 阶段 会 填充 图 5-23 的 符号 表 ， 此 时 ， 编 译 器 会 查阅 符号 表 来 确定 LDBA、 
STBA 和 DECI 指令 操作 数 的 地 址 。 

注意 ， 存 储 在 符号 表 中 的 值 并 不 是 执行 期 间 变 量 的 值 ， 而 是 存储 值 的 内 存 地 址 。 如 果 执 
行 时 用 户 给 j 输入 419， 那 么 存储 在 Mem[0004] 的 值 将 是 01A3 (hex)， 即 419 (dec) 的 二 进 
制 表示 。 在 翻译 时 ,符号 表 中 符号 j 的 值 是 0004 而 不 是 01A3。 在 翻译 时 C 变量 值 是 不 存在 
的 ， 它们 只 存在 于 执行 时 。 

在 HOL6 层 给 一 个 变量 赋值 对 应 于 在 Asmb5 层 把 值 存储 到 内 存 。 编 译 器 把 赋值 语句 

j += 5; 
翻译 为 

LDWA j,d 

ADDA 5,i 

STWA j,d 
这 里 ， 显 示 的 是 符号 而 不 是 地 址 。LDWA 和 ADDA 执行 赋值 语句 右边 的 计算 ， 把 计算 结果 
放 在 累加 器 中 。STWA 把 计算 结果 再 赋值 给 j。 

“ 值 ” 这 个 词 在 翻译 过 程 和 执行 过 程 中 是 有 区 别 的 。 在 翻译 过 程 中 ， 符 号 的 值 是 一 个 地 
tt; 在 执行 过 程 中 ， 变 量 的 值 是 内 存单 元 的 内 容 。 这 个 赋值 语句 说 明了 访问 全 局 变量 的 一 般 
规则 : 

。 一 个 变量 的 符号 值 是 这 个 变量 在 执行 时 其 值 的 地 址 。 

e 用 直接 寻 址 方式 访问 执行 时 的 变量 值 。 

在 本 例 中 ， 全 局 变量 j 的 符号 值 是 地 址 0004, LOWA 和 STWA 语句 使 用 直接 寻 址 方式 
访问 执行 时 的 变量 值 。 

类 似 地 ， 编 译 器 把 

ch++ 
翻译 为 

LDBA ch,d 


ADDA 1,i 
STBA ch,d 


与 j] 加 5 相同 的 指令 ， ADDA， 对 ch 执行 增 量 运算 ， 同 样 ， 因 为 ch 是 全 局 变量 ， 所 以 在 翻 
译 时 它 的 值 是 地 址 0003, LDBA 和 STBA 指令 使 用 直接 寻 址 方式 访问 执行 时 的 变量 值 。 
编译 器 把 

printf ("tc\ntd\n", ch, j); 


翻译 为 
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LDBA ch,d 

STBA charOut,d 

LDBA '\n',i 

STBA charOut,d 

DECO j,d 

LDBA '\n',i 

STBA charOut,d 
用 直接 寻 址 输出 全 局 变量 ch 和 j 的 值 。 

编译 器 必须 搜索 符号 表 来 建立 像 ch 这 样 的 符号 和 它 的 地 址 0003 之 间 的 关联 。 符 号 表 是 
一 个 数组 。 如 果 它 不 按照 符号 名 的 字母 顺序 维护 ， 那 么 要 在 表 中 定位 ch 就 需要 进行 顺序 搜 
索 ; 如 果 符 号 名 按照 字母 顺序 排序 ， 那 么 就 可 以 使 用 二 分 查找 。 


5.4.4 ”类 型 兼容 


为 了 了 解 在 HOL6 层 是 怎样 保证 类 型 兼容 
的 ,假设 一 个 C 程 序 中 有 两 个 变量 ， 整 型 ] 和 
浮 点 型 y。 同 时 假定 有 一 台 不 同 于 Pep/9 的 计算 : : 
机 ， 它 可 以 存储 和 处 理 浮 点 型 值 。 该 程序 的 编译 a l 
器 符号 表 可 能 会 看 上 去 像 图 5-24。 图 5-24 包含 浮 点 变量 程序 的 编译 器 符号 表 

现在 来 考虑 C 中 的 运算 j%8。% 是 模 运算 
符 ， 只 限于 对 整数 值 进行 运算 。 在 二 进 制 中 执行 j%8， 就 是 把 除了 最 右边 3 位 以 外 的 所 有 其 
他 位 都 置 为 0。 例如 ， 如 果 j 的 值 是 61(dec)= 0011 1101 (bin), ABA j%8 的 值 是 5 (dec) = 
0000 0101 (bin)， 就 是 把 0011 1101 除了 最 右边 3 位 外 的 所 有 其 他 位 都 置 为 0。 

假定 该 C 程序 中 有 下 面 的 语句 ; 

j=j % 8; 

编译 器 会 查阅 符号 表 并 确定 变量 j 的 kind 是 sInt， 同 时 识别 8 是 一 个 整 型 常量 并 确定 % 
运算 是 合法 的 ， 接 着 它 将 生成 目标 代码 

LDWA j,d 


ANDA 0x0007,i 
STWA j,d 


现在 假设 该 C 程序 中 有 下 面 的 语句 : 

y=y% 8; 

编译 器 会 查阅 符号 表 并 确定 变量 y 的 kind 是 sFloat, EME % 运算 是 不 合法 的 ， 因 为 
该 运算 仅 适 用 于 整 型 类 型 。 它 将 生成 出 错 信息 


error: float operand for % 


而 不 会 生成 目标 代码 。 然 而 如 果 没 有 类 型 检测 ， 将 会 生成 下 面 的 代码 : 


LDWA y,d 

ANDA 0x0007,i 

STWA y,d 

虽然 执行 它 不 会 生成 有 意义 的 结果 ,但 实际 上 也 确实 没有 什么 能 阻止 汇编 语言 程序 员 写 
出 这 样 的 代码 。 





[0] j 0003 sInt 
[1] y 0005 = sFloat. 
[2] ; 
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让 编译 器 检测 类 型 的 兼容 性 有 巨大 作用 。 它 可 以 防止 编写 无 意义 的 语句 ， 例 如 对 浮 点 型 
变量 执行 % 运算 。 当 在 AsmbS 层 直接 用 汇编 语言 编程 时 ， 没 有 类 型 兼容 检测 。 所 有 数据 都 
是 由 位 组 成 的 。 当 由 于 不 正确 的 数据 移 位 导致 漏洞 出 现时 ， 只 能 在 运行 时 而 不 能 在 翻译 时 检 
测 它 们 。 也 就 是 说 ， 它 们 是 逻辑 错误 而 不 是 语法 错误 。 众 所 周知 ， 逻 辑 错误 比 语 法 错误 更 难 
以 定位 。 


5.4.5 ”Pep/9 符号 跟踪 器 


对 应 于 C 内 存 模型 的 3 个 部 分 ，Pep/9 有 3 种 符号 跟踪 特性 : 用 于 全 局 变量 的 全 局 跟踪 
te; 用 于 参数 和 局 部 变量 的 栈 跟踪 器 ; 用 于 动态 分 配 变量 的 堆 跟 踊 器 。 为 了 跟踪 一 个 变量 ， 
程序 员 把 跟踪 标签 区 入 与 此 变量 相关 的 注释 中 ， 并 单 步调 试 程序 。Pep/9 的 集成 开发 环境 会 
显示 变量 的 运行 时 值 。 

有 两 种 跟踪 标签 : 

© 格式 跟踪 标签 

o 符号 跟踪 标签 
跟踪 标签 放 在 汇编 语言 注释 中 ， 对 生成 的 目标 代码 没有 影响 。 每 个 跟踪 标签 以 # 字 符 开始 ， 
向 符号 跟踪 器 提供 在 跟踪 窗口 中 如 何 格式 化 和 标记 内 存单 元 的 信息 。 在 汇编 代码 时 ， 跟 踪 标 
签 错误 会 作为 警告 ， 允 许 程序 继续 执行 ， 只 是 跟踪 功能 关闭 了 。 如 果 不 纠 正 错误 ， 就 一 直 无 
法 跟踪 。 

全 局 跟踪 器 允许 用 户 指 定 跟踪 哪个 全 局 符号 ， 只 需要 在 声明 全 局 变量 的 .BLOCK 行 的 注释 
中 放 一 个 格式 跟踪 标签 。 例 如 ， 图 5-22 中 的 这 两 行 ， 

ch: -BLOCK 1 ;global variable #1c 

j: -BLOCK 2 ;global variable #2d 

包含 格式 跟踪 标签 #1c 和 #2d。 第 一 个 格式 跟踪 标签 可 以 解读 为 “1 字 节 ， 字 符 。” 这 个 
跟踪 标签 让 符号 跟踪 器 把 符号 ch 本 身 和 符号 值 指定 的 地 址 处 的 1 字 节 内 存单 元 的 内 容 一 起 
显示 出 来 。 类 似 地 ， 第 二 个 跟踪 标签 让 符号 跟踪 器 显示 j 指定 的 地 址 处 的 2 字 节 单元 ， 把 单 
元 的 内 容 当 作 一 个 十 进 制 整数 。 

合法 的 格式 跟踪 标签 有 : 

#lc ”1 字 节 字符 

#1d ”1 字 节 十 进 制 

#2d ”2 字 节 十 进 制 

#lh ”1 字 节 十 六 进 制 

#2h ”2 字 节 十 六 进 制 
全 局 变量 不 要 求 使 用 符号 跟踪 标签 ， 因 为 Pep/9 符号 跟踪 器 会 从 放置 跟踪 标签 的 .BLOCK 行 
获取 该 符号 。 但 是 局 部 变量 要 求 使 用 符号 跟踪 标签 ， 这 将 在 第 6 章 中 讲述 。 


5.4.6 算术 移 位 和 循环 移 位 指令 

Pep/9 有 两 个 算术 移 位 指令 和 两 个 循环 移 位 指令 。 这 4 条 指令 都 是 一 元 指令 ， 它 们 的 指 
令 指 示 符 、 助 记 符 和 所 影响 的 状态 位 如 下 所 示 : 

0000 101lr ”ASLr 算术 左 移 r NZVC 

0000 110r ”ASRr 算术 右 移 r NZC 
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0000 111lr ”ROLr 循环 左 移 T C 

0001 000r RORr 循环 右 移 FT C 

算术 移 位 和 循环 移 位 指令 没有 操作 数 指示 符 。 每 条 指令 根据 r 的 值 决定 作用 于 累加 器 还 
是 变 址 寄存 器 。 如 第 3 章 所 述 ， 算 术 左 移 是 有 符号 整数 乘 以 2， 算术 右 移 是 有 符号 整数 除 以 
2。 循 环 左 移 是 每 位 往 左 移动 1 位 ， 最 高 有 效 位 移 到 C 位 ，C 位 移 到 最 低 有 效 位 ; 循环 右 移 
是 每 位 往 右 移动 1 位 ， 最 低 有 效 位 移 到 C 位 ，C 位 移 到 最 高 有 效 位 。 

ASLr 指令 的 寄存 器 传送 语言 (RTL) 描述 是 

C«r<0>,7 r<0..14> «— r<1,..15>, r<15> <0 

N+r<0,Z+r=0, V+ {iH} 

ASRr 指令 的 RTL 描述 是 

Cr<15>, r<1..15> +— r<0..14>; Ner<0,Z+-1r=0 

ROLr 指令 的 RTL 描述 是 

C 二 TI<0>, r<0..14> 二 r<1..15>, r<15> 二 C 

RORr 指令 的 RTL 描述 是 

C 二 TI<15>, r<1,.15> +— r<0..14>, r<0> +— C 

假定 要 执行 指令 的 十 六 进 制 形式 为 0C， 图 5-25 是 它 的 二 进 制 表示 。 操 作 码 表 
明 将 执行 ASRr 指令 ， 寄 存 器 字段 表明 指令 将 作用 于 累加 器 。 

图 5-26 展示 了 假设 累加 器 的 初始 内 容 为 0098 (hex) =152 (dec) 时 ,执行 ASRA 指令 
的 结果 。ASRA 指令 将 位 模式 改变 为 004C (hex) =76 ( dec)， 这 个 值 是 152 的 一 半 。 因 为 累 
加 器 中 的 数 为 正 ， 所 以 N 位 为 0 ; 因为 累加 器 不 为 全 0， 所 以 Z 位 为 0 ; 因为 位 移 前 最 低 有 
效 位 为 0， 所 以 C 位 为 0。 


CPU eno 
a nzc[__] oc NZC 
d ~ 
^ RMR | a 
onoo rofe] 
0 c a) 执行 前 b ) 执行 后 
图 5-25 ASRA 指令 图 5-26 执行 ASRA 指令 n 


5.4.7 ”常量 和 .EQUATE 


-EQUATE 是 少数 几 个 不 生成 目标 代码 的 伪 操 作 之 一 。 此 外 ， 从 目标 代码 地 址 获取 符号 
值 的 标准 机 制 在 这 里 不 起 作用 。.EQUATE 的 操作 说 明 如 下 : 

e 它 一 定 在 定义 符号 的 行 中 。 

e 它 使 得 符号 的 值 等 于 跟 在 EQUATE 之 后 的 值 。 

。 它 不 生成 任何 目标 代码 。 

C 编译 器 用 .EQUATE 点 命令 翻译 C 常量 。 

除了 变量 是 全 局 的 而 不 是 局 部 的 之 外 ， 图 5-27 中 的 C 程序 和 图 2-6 中 的 程序 是 一 样 的 。 
它 展示 了 怎样 把 一 个 C 常量 翻译 为 机 器 语言 ， 同 时 也 说 明了 ASRA 汇编 语言 语句 的 使 用 。 
这 个 程序 计算 两 次 测验 的 平均 分 加 上 10 分 奖励 分 后 得 到 的 分 值 。 
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高 级 语言 

#include <stdio.h> 
const int bonus = 
int examl; 

int exam2; 

int score; 


int main() { 


scanf ("%d %d", &examl, &exam2) ; 
score = (examl + exam2) / 2 + bonus; 
printf ("score = %d\n", score); 
return 0; 


} 


汇编 语言 
0000 120009 BR 

. EQUATE ¿constant 
0003 0000 : . BLOCK ;global variable #2d 
0005 0000 $ .BLOCK ;global variable #2d 
0007 0000 P .BLOCK ;Global variable #2d 


0009 310003 DECI examl,d ;scanf ("td td", &examl, 
000C 310005 DECI exam2,d ; &exam2) 
000F C10003 LDWA examl,d ;Score = (examl 
0012 610005 ADDA exam2,d ; + exam2) 
0015 oc ASRA ef 2 
0016 60000A ADDA bonus, i ; + bonus 
0019 £10007 STWA score,d 
001C 490029 STRO msg,d printf ("score = d\n", 
OO1F 390007 DECO score,d ; score) 
0022 DOOOOA LDBA i T LEE | 
0025 F1FC16 STBA charOut,d 
0028 00 STOP 
0029 73636F 3 -ASCII "score = \x00" 
726520 
3D2000 
0032 


Symbol table 





图 5-27 ”一 个 程序 ， 编 译 器 会 把 它 的 C 常量 翻译 成 机 器 语言 


178 BORD 汇编 居 (FIA) 


编译 器 把 

const int bonus = 10; 
翻译 为 

bonus: .EQUATE 10 


5-27 中 的 汇编 语言 代码 有 两 点 值得 注意 。 首 先 ， 含 有 EQUATE 的 行 在 机 器 语言 列 
中 是 没有 代码 的 。 由 于 没有 代码 ， 地 址 也 就 不 适用 了 ， 所 以 甚至 在 地 址 列 中 都 没有 地 址 。 
这 和 EQUATE 不 生成 代码 的 规则 相 一 致 。 其 次 ， 图 5-27 包括 来 自 汇编 器 代码 列表 的 符号 
表 。 从 表 中 可 以 看 到 符号 bonus 的 值 为 000A (hex)， 即 10 (dec)。 相 反 ， 符 号 examl 的 值 
为 5， 因 为 给 它 生 成 代码 的 .BLOCK 点 命令 在 地 址 0005 (hex) Xb. {A bonus RERE, € 
被 EQUATE 点 命令 设置 为 000A。 

IO 和 赋值 语句 类 似 于 前 面 的 程序 。Scanf() 翻译 为 DECI，printf() 翻译 为 DECO 或 
STBA 翻译 为 charOut， 对 于 全 局 变量 都 采用 直接 寻 址 方式 。 一 般 来 说 ， 赋 值 语 句 翻译 为 

o 装 人 寄存 器 。 

e 如 果 需 要 ， 对 表达 式 求 值 。 

e 存储 寄存 器 。 

为 了 计算 表达 式 


(examl + exam2) / 2 + bonus 


编译 器 生成 代码 把 exam! 的 值 装 入 累加 器 ， 再 加 上 exam2 的 值 ， 然 后 用 ASRA 指令 把 和 除 
以 2。LDWA 和 ADDA 指令 使 用 直接 寻 址 ， 因 为 examl 和 exam2 是 全 局 变量 。 

但 编译 器 怎样 生成 加 bonus 的 代码 呢 ? 它 不 能 用 直接 寻 址 ， 因 为 没有 目标 代码 对 应 于 
bonus， 因 此 也 就 没有 地 址 。 取 而 代 之 的 是 语句 


ADDA bonus,i 


使 用 立即 数 寻 址 。 此 时 ， 操 作 数 指示 符 000A (hex) =10 (dec) 就 是 要 加 上 的 值 。 把 C 
常量 翻译 到 汇编 语言 的 一 般 规则 是 : 

e 用 .EQUATE 声明 常量 。 

o 用 立即 数 寻 址 访问 常量 。 

在 更 为 实际 的 程序 中 ，score 的 类 型 会 是 float， 要 用 实数 除法 运算 来 计算 平均 分 。Pep/9 
没有 硬件 支持 实数 ， 它 的 指令 集 也 不 包含 整数 乘法 和 除法 指令 。 这 些 运 算 一 定 要 用 算术 左 移 
和 算术 右 移 指令 编程 来 实现 。 


5.4.8 ”指令 与 数据 的 放置 


本 书 的 目的 是 展示 典型 计算 机 系统 中 抽象 层次 之 间 的 关联 。 所 以 ，Asmb5 层 翻 译 出 来 
的 整体 程序 结构 对 应 于 被 翻译 的 HOL6 程序 的 结构 。 具 体 来 说 ， 在 Asmb5 程序 和 HOL6 FÈ 
序 中 ,全 局 变量 都 出 现在 主 程序 的 前 面 。 实 际 的 编译 器 并 没有 这 个 约束 ， 经 常会 改变 程序 和 
数据 的 位 置 。 图 5-28 是 对 图 5-27 中 C 程序 的 一 个 不 同 的 翻译 结果 ， 这 个 翻译 的 一 个 好 处 是 
没有 程序 开始 处 跳 转 到 主 程序 的 那个 分 支 语句 。 
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310020 main: exami,d ;scanf("%d td", &examl, 
310022 exam2,d ; &exam2) 

C10020 examl,d ;score = (examl 

610022 exam2,d ; + exam2) 

oc ¿i2 

60000A bonus, i ; + bonus 

E10024 STWA score,d 

490026 STRO msg,d ¡printf ("score = %d\n", 
390024 DECO score,d ; score) 

DOOOOA LDBA aS o re A 

FIFC16 STBA charOut,d 

00 STOP 


. EQUATE 10 ;constant 
0000 : . BLOCK ;global variable #2d 


0000 : .BLOCK 2 ;global variable #2d 
0000 ; .BLOCK 2 ;global variable #2d 
73636F i .ASCII "score = \x00" 

726520 

3D2000 


002F 


Symbol table 





图 5-28 图 5-27 中 C 程序 的 另 一 种 翻译 ， 指 令 和 数据 的 放置 不 同 


本 章 小 结 


汇编 器 是 一 个 把 汇编 语言 程序 翻译 为 等 效 机 器 语言 程序 的 程序 。 汉 “' 诺 依 曼 设 计 原 理 要 
求 指令 和 数据 都 存储 在 主 存 中 。 对 应 于 两 种 位 序列 ， 汇 编 语言 语句 有 两 种 类 型 。 对 于 程序 语 
句 ， 汇 编 语言 用 助 记 符 代替 操作 码 和 寄存 器 r 字 段 ， 十 六 进 制 代替 二 进 制 操作 数 指示 符 ， 助 
记 符 字母 代替 寻 址 方式 。 对 于 数据 语句 ， 汇 编 语言 使 用 伪 操 作 ， 也 叫 作 点 命令 。 

使 用 直接 寻 址 方式 时 ， 操 作 数 指示 符 是 操作 数 的 主 存 地 址 ， 而 使 用 立即 数 寻 址 方式 时 ， 
操作 数 指示 符 就 是 操作 数 ， 以 数学 方法 表示 为 Oprnd = OprndSpec。 立 即 数 寻 址 比 直接 寻 址 
更 好 ， 因 为 立即 数 寻 址 的 操作 数 不 需 要 和 指令 分 开 存储 。 因 为 在 指令 寄存 器 中 的 操作 数 对 
CPU 来 说 是 立即 可 用 的 ， 所 以 这 样 的 指令 执行 也 更 快 。 

汇编 语言 符号 消除 了 程序 中 需要 手工 确定 数据 和 指令 地 址 的 问题 。 符 号 的 值 是 一 个 地 
址 。 当 汇编 器 检测 到 一 个 符号 定义 时 ， 会 把 该 符号 和 它 的 值 存 储 到 符号 表 中 。 当 需要 使 用 某 
个 符号 时 ， 汇 编 器 会 用 符号 的 值 代替 符号 。 

高 级 语言 层 (HOL6 层 ) 的 变量 对 应 于 汇编 层 ( Asmb5 层 ) 的 内 存 位 置 。 在 HOL6 层 ， 
把 表达 式 赋值 给 变量 的 赋值 语句 会 在 Asmb5 层 翻译 为 一 个 装 人 (load), 后面 跟 一 个 表达 式 
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求 值 ， 再 跟 一 个 存储 (store), HOL6 层 的 类 型 兼容 通过 编译 器 和 它 的 符号 表 来 实现 ， 这 个 
符号 表 要 比 汇编 器 的 符号 表 复 杂 很 多 。 在 Asmb5 层 ， 唯 一 的 类 型 是 位 ， 可 以 对 任何 位 模式 
做 任何 操作 。 


练习 


5.1% 
*1. 把 下 列 机 器 语言 指令 转换 为 汇编 语言 ， 假 设 这 些 指 令 不 是 由 伪 操 作 生 成 的 : 
(a) 9AEF2A 
(b) 03 
(c) D7003D 
2. 把 下 列 机 器 语言 指令 转换 为 汇编 语言 ， 假 设 这 些 指令 不 是 由 伪 操作 生成 的 : 
(a) 82B7DE 
(b) 04 
(c) DF63DF 
*3. 把 下 列 汇 编 语言 指令 转换 为 十 六 进 制 机 器 语言 : 
(a) ASLA 
(b) DECI 0x000F,s 
(b) BRNE 0x01E6,i 
4. 把 下 列 汇编 语言 指令 转换 为 十 六 进 制 机 器 语言 : 
(a) ADDA 0x01FE, i 
(b) STRO 0x000D, sf 
(c) LDWX 0x01FF,s 
*5. 把 下 列 汇编 语言 伪 操 作 转 换 为 十 六 进 制 机 器 语言 : 
(a) .ASCIT "Bear\x00" 
(b) .BYTE 0xF8 
(c) .WORD 790 
6. 把 下 列 汇编 语言 伪 操 作 转 换 为 十 六 进 制 机 器 语言 : 
(a) .BYTE 13 
(b) -ASCII "Frog\x00" 
(c) .NORD -6 
*7. 预测 下 面 汇编 语言 程序 的 输出 : 
LDBA 0x0015,d 
STBA OxFC16,d 
LDBA 0x0014,d 
STBA OxFC16,d 
LDBA 0x0013,d 
STBA OxFC16,d 
STOP 


.ASCII "gum" 
. END 


8. 预测 下 面 汇编 语言 程序 的 输出 : 


LDBA 0x000E,d 
STBA OxFC16,d 
LDBA 0x000D,d 
STBA OxFC16,d 
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STOP 
.RSCII "is" 
.END 
9. 如 果 输 入 为 g， 预 测 下 面 汇编 语言 程序 的 输出 。 如 果 输 入 为 A， 预 测 下 面 汇编 语言 程序 的 输出 。 解 
释 两 个 结果 不 同 的 原因 : 
LDBA OxFC15,d 
ANDA 0x000A,d 
STBA OxFC16,d 
STOP 


-WORD OxOODF 
:END 


5.2 节 
*10. 如 果 点 命令 变 成 下 面 这 样 ， 预 测 图 5-13 程序 的 输出 : 


.WORD OxFFC7 ;First 


.BYTE 0x00 ; Second 
BYTE He ; Third 
«WORD 873 ;Fourth 


11. 如 果 点 命令 变 成 下 面 这 样 ， 预 测 图 5-13 程序 的 输出 : 


.WORD OxFE63 ;First 


-BYTE 0x00 ; Second 
.BYTE 'b' ; Third 
.WORD 1401 ;Fourth 
12. 确定 下 列 汇编 语言 的 目标 代码 并 预测 输出 : 
*(a) (b) 
DECO: ‘'m',i DECO 'Q',i 
LDBA '‘'\n',i LDBA '\n',i 
STBA OxFC16,d STBA OxFC16,d 
DECO "mm",i DECO OxFFC3,i 
EDBA '\n',i LDBA '\n',i 
STBA OxFC16,d STBA OxFC16,d 
LDBA 0x0026,i LDBA 0x007D,i 
STBA OxFCi6,d STBA OxFC16,d 
STOP STOP 
. END . END 
5.375 
*13. 在 下 面 的 代码 中 ， 请 确定 符号 here 和 there 的 值 。 写 出 十 六 进 制 目标 代码 (不 需 预 测 输出 )。 
BR there 
here: -WORD 9 
there: DECO here,d 
STOP 
. END 
14. 在 下 面 的 代码 中 ， 请 确定 符号 this, that 和 theOther 的 值 。 写 出 十 六 进 制 目标 代码 (不 需 预测 输出 )。 
BR theOther 
this: -WORD 17 
that: -WORD 19 


theOther: DECO this,d 
DECO that,d 
STOP 
. END 
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*15. 在 下 面 的 代码 中 ， 请 确定 符号 this 的 值 。 预 测 并 解释 汇编 语言 程序 的 输出 : 
this: HEXO this,d 
STOP 
. END 
16. 在 下 面 的 代码 中 ， 请 确定 符号 this 的 值 。 预 测 并 解释 汇编 语言 程序 的 输出 : 
this: DECO this,d 
STOP 
. END 


5.4% 
17. 汇编 器 和 编译 器 的 符号 表 有 哪些 类 似 的 地 方 ? 有 哪些 不 同 的 地 方 ? 
18. C 编译 器 是 怎样 保证 类 型 兼容 的 ? 
19. 假定 你 有 一 台 Pep/9 型 计算 机 和 下 面 的 磁盘 文件 : 
o A 文件: 用 机 器 语言 写 的 Pep/9 汇编 语言 汇编 器 
e BCH: 用 汇编 语言 写 的 C 到 汇编 语言 的 编译 器 
e C 文件 : 从 一 个 数据 文件 读 人 数字 并 输出 中 位 数 的 C 程序 
e D 文 件 : C 文件 中 求 中 位 数 程序 的 数据 文件 
要 计算 中 位 数 ， 需 要 图 5-29 所 示 让 计算 机 运行 4 次 ， 每 次 运行 都 包括 一 个 输入 文件 ， 某 个 程序 会 
处 理 它 ， 并 生成 一 个 输出 文件 。 前 一 次 运行 生成 的 输出 文件 可 以 作为 后 面 运行 的 输入 文件 ， 或 者 作 
为 要 运行 的 程序 。 描 述 文件 E、F、G 和 再 的 内 容 ， 用 适当 的 文件 字母 标注 图 5-29 中 的 空 框 。 


输入 处 理 输出 
nl[ 
nn CC) 


图 5-29 练习 19 的 计算 机 运行 情况 


编程 题 


5.1 节 

20. 写 一 个 在 屏幕 上 输出 你 名 字 的 汇编 语言 程序 。 要 求 使 用 .ASCII 伪 操 作 在 程序 的 底部 存储 字符 。 使 
用 LDBA 指令 用 直接 寻 址 方式 从 名 字 字 符 串 输出 字符 。 输 出 的 名 字 必 须 包含 两 个 以 上 的 字母 。 

5.2 节 

21. 写 一 个 在 屏幕 上 输出 你 名 字 的 汇编 语言 程序 。 要 求 对 于 你 名 字 中 的 每 个 字母 ，LDBA 的 操作 数 都 使 
用 字符 常量 立即 数 寻 址 。 

22. 写 一 个 在 屏幕 上 输出 你 名 字 的 汇编 语言 程序 。 要 求 对 于 你 名 字 中 的 每 个 字母 ，LDBA 的 操作 数 都 使 
用 十 进 制 常量 立即 数 寻 址 。 

23. 写 一 个 在 屏幕 上 输出 你 名 字 的 汇编 语言 程序 。 要 求 对 于 你 名 字 中 的 每 个 字母 ，LDBA 的 操作 数 都 使 
用 十 六 进 制 常量 立即 数 寻 址 。 

5.4 节 
下 面 的 C 程序 没有 显示 include <stdio.h> 语句 ， 程 序 编译 是 需要 该 语句 的 。 

24. 写 出 对 应 于 下 面 C 程序 的 汇编 语言 程序 : 


int numl 
int num2; 


HIF Me 


int main () { 
scanf ("td %d", &numl, &num2); 
printf ("%d\ntd\n", num2, numi); 
return 0; 


} 
25. 写 出 对 应 于 下 面 C 程序 的 汇编 语言 程序 : 


const char chConst = 'a'; 

char chi; 

char ch2; 

int main () { 
scanf("$c%c", &chi, &ch2) ; 
printf ("tc%c%c\n", chl, chConst, 
return 0; 


} 
26. 写 出 对 应 于 下 面 C 程序 的 汇编 语言 程序 : 


const int amount = 20000; 
int num; 
int sum; 


int main () { 
scanf ("%d", &num) ; 
sum = num + amount; 
print£ ("sum = %d\n", sum); 
return 0; 


} 


测试 程序 两 次 。 第 一 次 ， 给 num 输入 一 个 值 使 得 sum 在 Pep/9 计算 机 人 允许 的 范围 内 。 第 二 次 ， 输 
入 在 允许 范围 内 的 num 值 ， 但 是 使 sum 超出 范围 。 注 意 超出 范围 的 条 件 不 会 导致 错误 信息 ， 只 是 


会 给 出 一 个 不 准确 的 值 。 解 释 这 个 值 。 
27. 写 出 对 应 于 下 面 C 程序 的 汇编 语言 程序 : 


int width; 
int length; 
int perim; 


int main () { 
scanf ("%d td", &width, &length) ; 
perim = (width + length) * 2; 
printf ("width = %d\n", width); 


ch2) ; 


printf("length = %d\n\n", length); 


printf ("perim = %d\n", perim) ; 
return 0; 


} 
28. 写 出 对 应 于 下 面 C 程序 的 汇编 语言 程序 : 


char ch; 


int main () { 
scanf ("%c", &ch); 
ch--; 
printf ("%c\n", ch); 
return 0; 
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29. 写 出 对 应 于 下 面 C 程序 的 汇编 语言 程序 : 
int numl; 
int num2; 
int main () { 
scanf ("%d", &num1) ; 
num2 = -numl; 


sd\n", numl); 
$d\n", num2); 


printf ("numl 
printf ("num2 


return 0; 


} 
30. 写 出 对 应 于 下 面 C 程序 的 汇编 语言 程序 : 


int num; 


int main () { 
scanf("%d", &num) ; 
num = num / 16; 
printf ("num = %d\n", num); 
return 0; 


} 
31. 写 出 对 应 于 下 面 C 程序 的 汇编 语言 程序 : 
int num; 


int main () { 
scanf ("%d", &num); 
num = num % 16; 
printf ("num = %d\n", num); 
return 0; 
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| 第 6 章 


Computer Systems, Fifth Edition 


编译 到 汇编 层 





本 书 的 主题 是 抽象 层次 的 概念 在 计算 机 系统 中 的 应 用 。 本 章 继续 这 一 主题 ， 向 你 展示 高 
级 语言 层 和 汇编 层 之 间 的 抽象 层次 关系 。 本 章 审视 HOL6 层 的 C 语言 特性 ， 展 示 编 译 器 怎 
样 把 具有 这 些 特 性 的 程序 翻译 为 等 效 的 Asmb5 层 程序 。 

HOL6 层 语 言 和 Asmb5 层 语 言 的 一 个 主要 区 别 在 于 Asmb5 层 没 有 大 量 的 数据 类 型 。 在 
C 中 ,几乎 可 以 任意 组 合 定义 整数 、 实 数 、 数 组 、 布 尔 和 结构 ,但 汇编 语言 具有 位 和 字 节 。 
如 果 要 用 汇编 语言 定义 一 个 结构 数组 ， 就 必须 相应 地 区 分 位 和 字 节 。 如 果 在 HOL6 层 编程 ， 
编译 器 会 自动 完成 这 个 工作 。 

两 者 之 间 的 男 一 个 不 同 与 控制 流 有 关 。C A if. while, do, for, switch 和 函数 语句 来 
改变 正常 顺序 的 控制 流 ， 但 汇编 语言 受 冯 “' 诺 依 曼 基 本 设计 所 限 ， 只 能 使 用 很 原始 的 控制 语 
句 。 本 章 将 展示 编译 器 必须 怎样 把 几 个 原始 的 Asmbs 层 控制 语句 联合 在 一 起 来 执行 一 条 更 
强大 的 HOL6 层 控 制 语句 。 


6.1 栈 寻 址 和 局 部 变量 

当 程 序 调用 函数 时 ， 程 序 为 返回 值 、 参 数 和 返回 地 址 在 运行 时 栈 上 分 配 存储 空间 ， 然 后 
函数 给 它 的 局 部 变量 分 配 存储 空间 。 栈 相对 寻 址 允许 函数 访问 被 压 入 栈 中 的 信息 。 

可 以 把 C 程序 中 的 main) 看 作 操作 系统 调用 的 函数 。 你 可 能 比较 熟悉 主 程序 有 arge 和 
argv 两 个 参数 ， 像 下 面 这 样 : 

int main(int argc, char* argv[]) 
用 这 样 的 方式 声明 main() 函数 ，argv 和 arge 与 返回 地 址 和 局 部 变量 一 起 被 压 人 运行 时 栈 。 

为 了 使 事情 更 简单 ， 本 书 总 是 把 main() 声明 为 不 带 参数 ， 并 忽略 给 整数 返回 值 和 返回 
地 址 分 配 存储 空间 这 一 事实 。 因 此 ， 在 运行 时 栈 上 给 main() 分 配 的 唯一 存储 空间 就 是 给 局 
部 变量 的 。 图 2-19a 展示 了 运行 时 栈 上 有 返回 值 和 返回 地 址 的 内 存 模型 。 图 2-23a 展示 了 这 
种 简化 的 内 存 模型 。 


6.1.1 栈 相 对 寻 址 


使 用 栈 相对 寻 址 ， 操 作 数 和 操作 数 指示 符 之 间 的 关系 是 
Oprnd = Mem[SP + OprndSpec] 

栈 指针 作为 一 个 内 存 地 址 ， 操 作 数 指示 符 会 加 上 这 个 地 址 。 图 4-41 展示 了 用 户 栈 在 主 
存 中 从 地 址 FB8F 开始 向 上 增加 。 当 一 个 条 目 被 压 人 运行 时 栈 时 ， 它 的 地 址 小 于 栈 顶 条 目的 
地 址 。 

可 以 把 操作 数 指示 符 想 象 成 距离 栈 顶 的 偏 移 量 。 如 果 操 作 数 指示 符 是 0， 那么 指令 访问 
栈 项 的 值 Mem[SP]; 如 果 操作 数 指示 符 是 2， 那 么 就 访问 栈 顶 下 面 2 字 节 的 值 Mem[SP + 2]. 

Pep/9 指令 集 有 两 条 直接 用 于 操控 栈 指针 的 指令 : ADDSP 和 SUBSP (CALL, RET 和 
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RETTR 间接 操控 栈 指 针 )。ADDSP 简单 地 把 栈 指针 值 增加 一 个 值 ，SUBSP 将 栈 指针 值 减 去 
一 个 值 。ADDSP 的 RTL 描述 是 
SP <— SP + Opmd 
SUBSP 的 RTL 描述 是 
SP +— SP — Opmd 
这 两 条 指令 都 不 会 改变 状态 位 。 
尽管 可 以 对 指针 值 进行 加 / 减 ,但 是 不 能 用 装 入 指令 设置 栈 指针 的 值 。 没 有 LDSP 指令 。 
那么 究竟 怎样 设置 栈 指 针 呢 ? 当 在 Pep/9 模拟 器 上 选择 执行 选项 时 ， 会 发 生 下 列 两 个 动作 : 
SP 二 Mem[FFF4] 
PC +— 0000 
第 一 个 动作 把 栈 指针 设置 为 内 存 位 置 FFF4 的 内 容 。 这 个 位 置 位 于 操作 系统 的 ROM， 
它 包含 应 用 程序 运行 时 栈 顶 部 的 地 址 。 因 此 当选 择 执行 选项 时 ， 能 正确 地 初始 化 栈 指针 。 
Pep/9 操作 系统 会 把 SP 默认 初始 化 为 FB8F， 应 用 程序 绝 不 会 把 它 设置 为 任何 其 他 的 值 。 通 
常情 况 下 ， 应 用 程序 只 需要 在 把 条 目 压 入 运行 时 栈 时 减少 栈 指针 ， 在 把 条 目 弹 出 运行 时 栈 时 
增加 栈 指针 。 


6.1.2 访问 运行 时 栈 

图 6-1 展示 了 怎样 把 数据 压 人 栈 、 用 栈 相对 寻 址 访问 数据 ， 以 及 从 栈 中 弹出 数据 。 程 序 
把 字符 串 BMW 压 人 栈 ， 接 着 压 人 十 进 制 整数 335 和 字符 "i"， 然 后 输出 这 些 条 目 ， 并 把 它 
们 弹出 栈 。 


D00042 LDBA Ht yL ;move B to stack 

F3FFFF STBA -1,8 

D0004D LDBA M'i ;move M to stack 

F3FFFE STBA -2,8 

D00057 LDBA 'wi,i ;move W to stack 

F3FFFD STBA -3,8 

CO014F LDWA 335, £ move 335 to stack 

E3FFFB STWA =5,8 

D00069 LDBA > ;move i to stack 

F3FFFA STBA -6,8 

580006 SUBSP 6,i j;push 6 bytes onto stack 

D30005 LDBA 5,8 ;Output B 

F1FC16 STBA charOut,d 

D30004 LDBA 4,s ;output 

F1FC16 STBA charOut,d 

D30003 LDBA 3,8 ; output 

F1FC16 STBA charOut,d 

3B0001 DECO 1,8 ;output 

D30000 LDBA 0,s ;output i 

F1FC16 STBA charOut,d 

500006 ADDSP 6,i ;pop 6 bytes off stack 
STOP 





图 6-1 栈 相对 寻 址 
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6-2a 给 出 了 程序 执行 前 栈 指针 CSP) 和 主 存 的 值 。 机 器 根据 Mem[FFF4] 的 向 量 把 栈 
指针 初始 化 为 FB8F。 


SP ee SP 


FB8F 





a) 程序 执行 前 b) SUBSP 执行 后 
图 6-2 把 BMW335i 压 入 图 6-1 所 示 的 运行 时 栈 
前 两 条 指令 


0000 D00042 LDBA 'B',i ;move B to stack 
0003 F3FFFF STBA -1,s 


把 ASCI 字 符 "B" 放 和 栈 顶 上 面 的 那个 字 节 ，LDBA 把 "B" 字 节 放 入 累加 器 的 右 半 部 分 ， 
STBA 把 它 放 人 栈 顶 之 上 ， 存 储 指令 采用 栈 相 对 寻 址 ， 操 作 数 指示 符 为 -1 (dec) = FFFF 
(hex)。 因 为 栈 指针 的 值 是 FB8F ， 所 以 "B" 存储 在 Mem[FB8F + FFFF] = Mem[FB8E]。 接 
下 来 的 两 条 指令 分 别 把 "M" 和 "W" 放 在 Mem[FB8D] 和 Mem[FB8C]。 

然而 ,十进制 整数 335 占用 2 字 节 。 程序 必 须 把 它 存 储 在 距离 "W" 地 址 2 字 节 的 地 方 ， 
这 就 是 为 何 存储 335 的 指令 是 


0015 E3FFFB STWA -5,s 


而 不 是 STWA -4, 的 原因 。 通 常情 况 下 ， 当 把 一 个 条 目 压 人 运行 时 栈 时 ， 必 须要 考虑 每 个 
条 目 占用 的 字 节 数 ， 以 及 相应 地 设置 好 操作 数 指示 符 。 
SUBSP 指令 


001E 580006 SUBSP 6,i ;push 6 bytes onto stack 


把 栈 指 针 减 6， 如 图 6-2b 所 示 ， 这 就 完成 了 和 人 栈 操作 。 

跟踪 一 个 使 用 栈 相 对 寻 址 的 程序 不 需要 知道 栈 指针 的 绝对 值 。 如 果 栈 指针 被 初始 化 为 其 
他 值 ， 比 如 FA18， 入 栈 操 作 也 会 做 同样 的 
THE. MARAE, “Bis "M" W 335 
All "i" 2 4} Gl] FE Mem[FA17], Mem[FA16], 


Mem[FA15], Mem[FA13] 和 Mem[FA12], a E EESE 
栈 指针 最 后 会 变 成 FA12。 尽 管 绝对 内 存 位 
置 不 同 , 但 是 这 些 值 相对 于 栈 顶 的 位 置 都 是 4 4 
相同 的 。 

图 6-3 是 一 个 跟踪 运行 更 便捷 的 方法 ， sp 。。 o 


它 利 用 了 栈 指针 中 的 值 是 无 关 的 这 个 事实 。 
不 是 显示 栈 指针 的 值 ， 而 是 给 出 指向 内 存单 a) 程序 执行 前 b) SUBSP 执行 后 
元 的 箭头 ， 栈 指针 中 存放 着 这 个 内 存单 元 的 图 6-3 用 相对 寻 址 方式 的 图 6-2 的 栈 





188 BOD CRE (FIA) 


bits AR GLAR AES TCR AE, ALAA RE AAR AHL. DELP, BARRE 
例 来 画 运 行 时 栈 的 状态 图 。 

指令 

0021 D30005 LDBA 5,s ;output B 


从 栈 输出 ASCI 字符 "B", TERE, 在 SUBSP 执行 前 ，"B'" 的 栈 相对 地 址 是 -1， 但 是 执行 后 
变 成 了 5。 因 为 栈 指针 变 了 ， 所 以 它 的 栈 相对 地 址 不 同 了 。 


0003 F3FFFF STBA -1,s 


All 


021 D30005 LDBA 5,s ;output B 


访问 相同 的 内 存单 元 ， 因 为 当 它 们 执行 时 ，SP 的 值 是 不 同 的 。 如 图 6-3b 所 示 ， 同 样 也 都 用 
栈 偏 移 量 输出 其 他 条 目 。 

指令 

003C 500006 ADDSP 6,i ;pop 6 bytes off stack 


通过 对 SP 加 6 在 运行 时 栈 上 释放 了 6 字 节 的 存储 空间 。 因 为 栈 朝 着 更 小 地 址 的 方向 向 上 生 
长 ， 所 以 通过 减 小 栈 指针 值 分 配 存储 空间 ， 通 过 增加 栈 指针 值 释放 存储 空间 。 


6.1.3 ”局 部 变量 


前 一 章 我 们 讲 了 编译 器 怎样 翻译 程序 的 全 局 变量 。 用 .BLOCK 点 命令 给 全 局 变量 分 配 
存储 空间 ， 用 直接 寻 址 方式 进行 访问 。 然 而 ， 局 部 变量 是 在 运行 时 栈 上 分 配 的 ， 要 翻译 程序 
的 局 部 变量 ， 编 译 器 要 : 

o 用 SUBSP 将 局 部 变量 入 栈 。 

e 用 栈 相 对 寻 址 访问 局 部 变量 。 

e 用 ADDSP 将 局 部 变量 出 栈 。 

全 局 变量 和 局 部 变量 之 间 的 一 个 重要 不 同 点 是 分 配 发 生 的 时 间 。.BLOCK 点 命令 不 是 可 
执行 语句 ， 在 程序 执行 前 就 给 全 局 变量 的 存储 保留 了 固定 的 位 置 。 相 反 ，SUBSP 是 可 执行 
语句 ， 在 程序 执行 期 间 ， 在 运行 时 栈 上 创建 局 部 变量 的 存储 空间 。 

图 6-4 中 的 C 程序 来 自 图 2-6， 除 了 变量 被 声明 为 main() 的 局 部 变量 外 ， 和 图 5-26 中 
的 程序 是 一 样 的 。 尽 管 程序 的 用 户 感受 不 到 这 个 区 别 ， 但 是 编译 器 执行 的 翻译 却 非常 不 同 。 
图 6-5 给 出 了 这 个 程序 的 运行 时 栈 。 和 图 5-27 中 一 样 ，bonus 是 一 个 常量 ， 用 .EQUATE 来 
定义 。 不 过 ， 局 部 变量 也 用 .EQUATE 定义 。 对 于 常量 ，.EQUATE 指定 常量 的 值 ， 但 对 于 
局 部 变量 ，.EQUATE 指定 在 运行 时 栈 上 的 栈 偏 移 量 。 例 如 ， 图 6-5 显示 局 部 变量 exam] 
的 栈 偏 移 量 是 4， 因 此 汇编 语言 程序 使 得 符号 exam] 等 于 4。 在 汇编 语言 代码 中 可 以 看 
到 ，.EQUATE 不 会 为 局 部 变量 生成 任何 代码 。 

main() 中 可 执行 语句 的 翻译 有 两 方面 与 全 局 变量 不 同 。 首 先 ，SUBSP 和 ADDSP 在 运 
行 时 栈 上 给 局 部 变量 分 配 和 释放 内 存 。 其 次 ， 对 变量 的 访问 都 使 用 栈 相 对 寻 址 而 不 是 直接 寻 
址 。 除 此 之 外 ， 赋 值 和 输出 语句 的 翻译 是 一 样 的 。 

图 6-4 展示 怎样 写 局 部 变量 的 调试 跟踪 标签 。 汇 编 语言 程序 用 EQUATE 伪 操 作 使 用 格 
式 跟踪 标签 #2d， 告 诉 调试 器 examl 、exam2 和 score 应 该 显示 为 2 字 节 的 十 进 制 值 。 
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高 级 语言 


#include <stdio.h> 


int main() { 


const int bonus = 10; 

int examl; 

int exam2; 

int score; 

scanf ("td ¢d", &examl, &exam2) ; 
score = (examl + exam2) / 2 + bonus; 
printf ("score = ¢d\n", score); 
return 0; 


} 

汇编 语言 

0000 120003 BR 
. EQUATE ; constant 
. EQUATE jlocal variable #2d 
. EQUATE ;local variable #2d 
. EQUATE ;local variable #2d 


580006 in: SUBSP 6,i ;push #examl #exam2 #score 
330004 DECI exami, s scanf ("%d %d", &exami, &exam2) 
330002 DECI exam2, s 

C30004 exam1, s score = (examl + exam2) / 2 + bonus 
630002 exam2,s 

oc 

60000A bonus, i 

E30000 score,s 

490029 msg,d sprintf ("score = %d\n", score) 
3B0000 score,s 

DOOOOA oh «le 

F1FC16 charOut,d 

500006 6,i ;pop #score #exam2 #examl1 

00 

73636F h "score = \x00" 

726520 

3D2000 





图 6-4 一 个 具有 局 部 变量 的 程序 。 这 个 C 程序 来 自 图 2-6 


-6 score SP e> 0 score 

4 exam2 2 exam2 

-2 exami 4 exami 
SP e> A 7 


a) SUBSP 执行 前 b) SUBSP 执行 后 
图 6-5 图 6-4 程序 的 运行 时 栈 


用 SUBSP 指令 将 这 些 局 部 变量 压 人 运行 时 栈 ， 因 此 ， 为 了 调试 程序 ， 就 要 在 SUBSP 
的 注释 中 指定 3 个 符号 跟踪 标签 #examl, #exam2 和 #score。 单 步 跟 踪 程 序 时 ，Pep/9 系统 
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会 在 屏幕 上 显示 一 个 图 标 ， 就 像 图 6-5b 运行 时 栈 右边 的 单元 符号 标签 。 为 了 使 调试 器 能 够 
准确 工作 ， 注 释 字 段 中 列 出 的 符号 跟踪 标签 的 顺序 必须 与 它们 压 人 运行 时 栈 的 顺序 一 致 。 
在 这 个 程序 中 ，examl 首先 压 人 运行 时 栈 ， 然 后 是 exam2 和 score。 此 外 ， 这 个 顺序 必须 
和 EQUATE 伪 操作 中 的 偏 移 量 一 致 。 

用 ADDSP 指令 来 从 栈 中 弹出 变量 。 同 样 ， 列 出 变量 的 顺序 必须 与 弹出 运行 时 栈 的 顺序 
相对 应 。 因 为 变量 弹出 的 顺序 与 压 人 的 顺序 相反 ， 所 以 必须 以 与 SUBSP 指令 相反 的 顺序 列 
出 来 。 在 这 个 程序 中 ，score 首先 弹出 ， 接 着 是 exam2 和 exam1。 

尽管 程序 的 执行 不 需要 跟踪 标签 ， 但 是 它们 可 以 用 于 记录 程序 。 符 号 跟踪 标签 提供 的 信 
息 对 程序 的 阅读 者 来 说 是 非常 有 价值 的 ， 因 为 它 描述 了 SUBSP 和 ADDS. 指令 的 目的 。 本 
章 的 汇编 语言 程序 都 包括 为 了 记录 之 用 的 跟踪 标签 ， 你 写 程序 时 也 应 该 这 样 写 。 


6.2 ”分支 指令 和 控制 流 


Pep/9 指令 集 有 8 个 条 件 分 支 语 句 : 

BRLE 小 于 等 于 分 支 

BRLT 小 于 分 支 

BREQ 等 于 分 支 

BRNE 不 等 于 分 支 

BRGE 大 于 等 于 分 支 

BRGT 大 于 分 支 

BRV V 分 支 

BRC CHR 

每 个 条 件 分 支 检 测 4 个 状态 位 N、Z、V 和 C 中 的 一 个 或 者 两 个 。 如 果 条 件 为 真 ， 那 么 
操作 数 放 入 程序 计数 器 ( PC)， 发 生 转 移 ; 如 果 条 件 为 假 ， 操 作 数 不 放 人 PC， 条 件 分 支 后 面 
的 指令 正常 执行 。 可 以 把 这 想象 成 一 个 16 位 的 结果 和 0000 (hex) 做 比较 。 例 如 ，BRLT 检 
测 结果 是 否 小 于 0， 如 果 N 为 1， 则 小 于 0 ; BRLE 检测 结果 是 否 小 于 等 于 0， 如 果 N 为 1 
或 者 Z 为 1， 则 小 于 等 于 0。 每 个 条 件 分 支 指令 的 RTL 描述 如 下 : 

BRLE N=1vZ=1= PC Oprnd 

BRLT N = 1 = PC ¢ Oprnd 

BREQ Z= 1 => PC & Oprnd 

BRNE Z=0 = PC ¢ Oprnd 

BRGE N=0=> PC ¢ Oprnd 

BRGT N=0AZ=0=> PC¢ Oprnd 

BRV V =1 > PC & Oprnd 

BRC C= 1 = PC ée Oprnd 


分 支 是 否 发 生 取 决 于 状态 位 的 值 ， 其 他 指令 的 执行 也 会 影响 状态 位 。 例 如 ， 

LDWA num,s 

BRLT place 
把 num 的 内 容 装 人 累加 器 。 如 果 装 人 的 这 个 字 是 负数 ， 即 它 的 符号 位 为 1,， 那么 N 位 被 置 
为 1。BRLT 检测 N 位 并 分 支 到 位 于 place 的 指令 。 另 一 方面 ， 如 果 装 人 累加 器 的 不 是 负数 ， 
那么 N 位 为 0， 当 BRLT 检测 N 位 时 ， 不 会 发 生 分 支 ， 接 下 来 会 执行 BRLT 后 面 的 指令 。 
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6.2.1 翻译 if 语句 


图 6-6 展示 了 编译 器 怎样 把 让 语句 从 C 翻译 成 汇编 语言 。 这 个 程序 计算 一 个 整数 的 绝 
对 值 。 


高 级 语言 


#include <stdio.h> 


int main() { 
int number; 
scanf ("%d", &number) ; 
if (number < 0) { 

number = -number; 

} 
printf ("%d", number); 
return 0; 

} 

汇编 语言 

0000 120003 BR 

-EQUATE 0 ;local variable #2d 


580002 SUBSP 2,1 ;push #number 
330000 DECI number,s ;scanf("%d", &number) 
C30000 if: LDWA number,s ;if (number < 0) 
100016 BRGE endif 
C30000 LDWA number,s ;Mumber = -number 
08 NEGA 
E30000 STWA number, s 
3B0000 endIf: DECO number,s ;printf("td", number) 
500002 ADDSP ae ;pop #number 
00 STOP 
. END 





图 6-6 HOL6 层 和 Asmbs 层 的 if i5% 


汇编 语言 注释 显示 对 应 的 高 级 语言 程序 。scanf() 函数 调用 翻译 为 DECI，printf() 函数 调 
用 翻译 为 DECO， 赋 值 语 句 翻译 为 LDWA、NEGA、STWA 序列 。 
编译 器 把 计 语 句 转换 为 LDWA 、BRGE 序列 。LDWr 的 RTL 描述 是 


r Oprnd;Ner<0,Z¢r=0 295 
l 


当 执行 LDWA 时 ， 如 果 装 入 累加 器 的 值 是 正 数 或 零 ， 那 么 N 位 为 0。 这 个 条 件 会 跳 |296 
过 让 语句 主体 。 图 6-7a 展示 了 HOL6 层 的 让 语句 结构 ，S1 代表 scanf) 函数 调用 ，C1 代 
表 条 件 number<0，S2 代表 语句 number= 
—number, ffl S3 ft X if 4) printf() 函数 调 


用 。 图 6-7b 展示 了 使 用 Asmb5 层 更 加 原始 ea n 
的 分 支 指令 的 结构 。C1 PMN ARRAY s2 
转移 BRGE. L J 
限定 复合 语句 的 花 括号 {} 在 汇编 语言 a) HOL6 层 的 结构 b) Asmbs 层 上 同样 的 结构 


中 没有 对 应 的 内 容 。 下 面 的 序列 图 6-7 图 6-6 中 并 语句 的 结构 
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语句 1 

if (number) >= 0{ 
语句 2 
语句 3 

} 

语句 4 


翻译 为 
语句 1 
if: LDA number, d 


BRLT endif 
语句 2 


endif: 语句 4 


6.2.2 ”优化 编译 器 


你 可 能 已 经 注意 到 图 6-6 有 一 个 不 是 特别 必要 的 装 入 语句 。 可 以 删除 000F 处 的 LOWA, 
因为 前 面 在 0009 处 装 入 的 number 的 值 仍 然 在 累加 器 中 。 

问题 是 编译 器 该 怎么 做 呢 ? 答案 取决 于 编译 器 。 编 译 器 是 一 个 需要 编写 和 调试 的 程序 。 
假想 需要 设计 一 个 把 C 翻译 到 汇编 语言 的 编译 器 。 当 编译 器 检测 到 赋值 语句 时 ， 编 程 产 生 
下 面 的 序列 : 装 入 累加 器 ; 如 果 需 要 ， 对 表达 式 求 值 ; 把 结果 存储 到 变量 。 这 样 编译 器 就 会 
生成 图 6-6 那样 的 代码 , 在 000F 有 LDWA 语句 。 

可 以 想象 如 果 要 删除 不 必要 的 装 人 语句 ， 对 于 编译 器 程序 来 说 有 多 大 的 难度 。 当 编译 器 
检测 到 赋值 语句 时 ， 它 并 不 总 是 生成 初始 的 装 人 语句 ， 而 是 分 析 前 面 生成 的 指令 ， 记 住 累 
加 器 的 内 容 。 如 果 它 发 现 累 加 器 的 值 和 初始 装 人 语句 要 放 在 那里 的 值 一 样 ， 就 不 生成 初始 装 
和 人 语句。 在 图 6-6 中 ,编译 器 需要 记 住 ， 根据 让 语句 生成 的 代码 ，number 的 值 仍 然 在 累加 
器 中 。 

一 个 尽力 使 目标 程序 更 短 更 快 的 编译 器 叫 作 优化 编译 器 。 可 以 想象 设计 优化 编译 器 比 设 
计 非 优化 编译 器 难 很 多 。 不 仅 优化 编译 器 更 难 编写 ， 而 且 也 需要 更 长 时 间 编 译 ， 这 是 因为 这 
种 编译 器 必须 更 仔细 地 分 析 源 程序 。 

优化 编译 器 和 非 优化 编译 器 哪个 更 好 呢 ? 这 取决 于 使 用 编译 器 来 干什么 。 如 果 是 开发 软 
件 ， 为 了 测试 和 调试 一 个 过 程 需要 大 量 的 编译 ， 那么 就 需要 一 个 翻译 很 快 的 编译 器 ， 也 就 是 
非 优化 编译 器 。 如 果 是 一 个 大 型 固定 的 程序 ， 这 个 程序 会 被 许多 用 户 重 复 执行 很 多 遍 ， 那 么 
需要 目标 程序 更 快 地 执行 ， 因 此 这 时 需要 优化 编译 器 。 大 多 数 的 编译 器 提供 了 多 种 选项 ， 人 多 
许 开发 人 员 指 定 所 需 的 优化 级 别 。 通 常 ， 正 在 开发 和 调试 的 软件 使 用 非 优 化 编译 器 ， 最 后 一 
次 用 优化 编译 器 翻译 给 终端 用 户 。 

本 章 中 的 例子 偶尔 会 呈现 部 分 优化 的 目标 代码 ， 大 多 数 赋值 语句 以 非 优 化 的 形式 呈现 ， 
例如 图 6-6 中 的 赋值 语句 。 


6.2.3 翻译 if/else 语句 


图 6-8 说 明了 if/else 语句 的 翻译 。 这 个 C 程序 和 图 2-10 的 程序 一 样 。if 语 句 体 需要 一 
个 额外 的 无 条 件 分 支 语 句 绕 过 else 语句 体 。 如 果 编 译 器 省 略 0015 的 BR， 输 入 就 会 是 127, 
而 输出 将 会 是 highlow。 
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高 级 语言 


#include <stdio.h> 


int main() { 


const int limit 
int num; 
scanf ("%d", &num) ; 
if (mum >= limit) { 
printf ("high\n") ; 
} 
else { 
printf ("low\n") ; 
} 
return 0; 


} 
汇编 语言 
0000 120003 BR 
. EQUATE ;constant 
. EQUATE ;local variable #2d 


580002 SUBSP 2,i ;push #num 
330000 DECI num,s ¿scanf ("$d", &num) 
C30000 if: LDWA num, S ;if (mum >= limit) 
A00064 CPWA limit,i 
160018 BRLT else 
49001F STRO msgl,d ;Printf ("high\n") 
12001B BR endif 
490025 else: STRO msg2,d printf ("low\n") 
500002 endIf: ADDSP 2,i ;pop #num 
00 STOP 
686967 msgl: .RSCII "“high\n\x00" 
680A00 
6C6F77 msg2: .RSCII "low\n\x00" 
0A00 
. END 





图 6-8 HOL6 和 Asmb5 层 的 if/else 语句 。 这 个 C 程序 来 自 图 2-10 


和 图 6-6 不 一 样 的 是 图 6-8 的 证 语句 不 会 将 变量 的 值 和 零 比 较 ， 它 用 CPWA 把 变量 值 
和 另 一 个 非 零 值 进行 比较 ，CPWA 表示 比较 字 累 加 器 。CPWA 对 累加 器 减 去 操作 数 并 相应 地 
设置 NZVC 位 。 除 了 SUBr 把 结果 存储 在 寄存 器 7 (累加 器 或 变 址 寄存 器 )， 而 CPWr 忽略 减 
法 的 结果 外 ，CPWr 和 SUBr 是 一 样 的 。CPWr 的 RTL 描述 是 

Ter-Oprnd;N@T<0,Z<—T=0, V & {overflow}, C + {carry}; 

NeENOV 
这 里 工 表示 临时 值 。 

(这 里 对 N 位 有 一 个 调整 ， 即 N NOV, 这 在 减法 指令 中 是 没有 的 N 被 N 和 YV 的 异 
或 运算 代替 。 如 果 减 法 的 结果 产生 溢出 ,那么 N 位 就 正常 设置 ， 而 随后 的 条 件 分 支 指令 可 
能 会 执行 错误 的 分 支 。 因 此 ， 如 果 CPW 减法 操作 溢出 设置 了 V 位 ， 那么 N 位 就 会 从 其 正 
常 值 取 反 ， 并 且 不 会 复制 符号 位 。 通 过 这 种 调整 ， 比 较 操 作 扩展 了 有 效 比 较 的 范围 。 即 使 有 
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溢出 ，N 也 被 设置 为 好 像 没有 溢出 一 样 , 那么 随后 的 条 件 分 支 就 能 按 预 期 操作 。) 
这 个 程序 计算 num-limit 并 设置 NZVC 位 。BRLT 测试 N 位 ， 如 果 


num - limit < 0 


即 如 果 SI 
if (CI) { si 
num < limit $2 Cl 
} 
就 设置 N。 这 是 执行 else 部 分 的 条 件 。 ae { $2 
图 6-9 展示 了 这 两 层 上 的 控制 语句 结构 。 } $3 
图 6-9a 是 HOL6 层 的 控制 语句 ， 图 6-9b 是 这 34 Sx 
个 程序 到 Asmb5 层 的 翻译 。 a) HOL6 层 的 结构 b) Asmb5 层 上 同样 的 结构 


图 6-9 图 6-8 # if/else 语句 的 结构 
6.2.4 翻译 while 循环 


循环 需要 分 支 到 前 面 的 指令 。 图 6-10 展示 了 while 语句 的 翻译 。 这 个 C 程序 和 图 2-13 
的 程序 一 样 ， 它 把 输入 的 ASCII 字符 回 显 到 输出 ， 用 换行 符 蔡 换 空 格 符 ， 用 * 作为 标记 符 
号 。 如 果 输 入 是 一 行 字符 Hello, world!*， 则 输出 两 行 ， 一 行 是 Hello， 男 一 行 是 world | 。 


高 级 语言 


#include <stdio.h> 
char letter; 


int main() { 
scanf ("$c", &letter) ; 
while (letter != '*') { 
if (letter == ' ') { 
printt("\n") g 
} 
else { 
printf£("%c", letter) ; 
} 
scanf ("%c", &letter) ; 
} 


return 0; 


} 

汇编 语言 

0000 120004 

0003 00 letter: 1 ;global variable #1c 


0004 D1FC15 main: chariIn,d ¡scanf ("$c", &letter) 
0007 F10003 letter,d 

000A D10003 while: letter,d jwhile (letter != '*') 
000D B0002A 

0010 18002E 

0013 B00020 if: aid 74E (Letter == * “) 
0016 1A0022 

0019 DOOOOA printf ("\n") 

001C FI1FC16 charOut,d 





图 6-10 HOL6 和 AsmbS 层 的 while 语句 。 这 个 C 程序 来 自 图 2-13 
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120025 endif 
F1FC16 else: charOut,d ;print£("%c", letter) 
D1FC15 endIf: charin,d ;scanf("%c", &letter) 


F10003 letter,d 
12000A while 
00 endwh: 





图 6-10 (8%) 

对 while 语句 的 测试 是 在 循环 项 部 用 条 
件 分 支 实现 的 。 这 个 程序 检测 一 个 字符 值 ， SI 
它 是 1 字 节 的 量 。 每 个 while 循环 要 以 一 ne en ml 
个 无 条 件 分 支 结 束 ， 回 到 循环 顶部 的 测试 。 S2 S2 
002B 的 无 条 件 分 支 把 控制 带 回 开始 处 的 测 L 
试 。 图 6-11 展示 了 在 两 层 上 的 while 语句 a) HOL6 层 的 结构 b) Asmb5 层 上 同样 的 结构 
结构 。 图 6-11 图 6-10 中 while 语句 的 结构 


CPBr 的 RTL 描述 是 
T & 1(8..15) - byte Oprnd; N © T<0,Z¢ T=0,V¢0,Ce0 


这 里 T 表 示 的 是 一 个 8 位 的 临时 值 。 指 令 根据 这 个 8 位 值 设 置 状 态 位 ， 而 不 考虑 寄存 器 r 的 
高 位 字 节 。 即 使 累加 器 的 高 位 字 节 中 有 一 些 为 1 的 位 ， 图 6-10b 的 CPBA 指令 仍然 可 以 正常 
工作 。 

LDBr 的 RTL 描述 是 


r(8..15) — byte Oprnd; N & 0, Z € 1r(8..15) = 0 


与 CPBr 一样 ， 指 令 根据 8 位 值 设 置 状 态 位 ， 而 不 考虑 寄存 器 r 的 高 位 字 节 。 如 果 需 要 检 
Æ ASCII NUL 字 节 ， 可 以 把 这 个 字 节 装 人 累加 器 ， 并 直接 执行 BREQ ， 而 不 使 用 比较 字 节 
6.2.5 翻译 do 循环 
高 速 巡警 停 在 一 个 标识 后 面 ， 司 机 以 20 米 / 秒 超速 通过 ， 当 这 个 司机 沿 着 公路 驶 离 40 
米 后 ， 巡 警 以 25 米 / 秒 的 速度 去 追赶 超速 违法 者 ， 巡 警 在 离 标识 多 远 的 地 方 能 人 据 上 超 
速 者 ? 

图 6-12 的 程序 模拟 解决 这 个 问题 ， 它 和 图 2-14 的 程序 一 样 。cop 和 driver 的 值 是 两 者 
的 位 置 ， 初始 值 分 别 是 0 和 40。do 循环 的 每 次 执行 表示 时 间 过 去 1 秒 ， 在 此 期 间 巡 警 行进 
25 米 ， 超 速 者 行进 20 米 ， 一 直 持 续 到 巡警 追 上 超速 者 。 

do 语句 的 测试 在 循环 的 底部 。 在 这 个 程序 中 ， 编 译 器 把 while 转换 成 LDWA 、CPWA、 
BRLT 序列 。 如 果 N 位 被 置 为 1，BRLT 执行 分 支 。 由 于 CPWA 计算 两 者 之 间 的 差异 ， 即 
cop 一 driver， 所 以 如 果 

cop - driver < 0 
即 


cop < driver 
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N 位 被 置 为 1。 这 是 循环 重复 的 条 件 。 图 6-13 展示 了 在 第 6 层 和 第 5 层 的 do 语句 结构 。 
高 级 语言 
#include <stdio.h> 


int cop; 
int driver; 


int main() { 


cop = 0; 
driver = 40; 
do { 
cop += 25; 
driver += 20; 
} 
while (cop < driver); 
print£("%d", cop); 
return 0; 


} 


汇编 语言 

0000 120007 

0003 0000 cop: ;global variable #2d 

0005 0000 driver: ;global variable #2d 
i 

0007 C00000 main: 0,i ;cop = 0 

000A £10003 cop,d 

000D Cc00028 40,i ¿driver 

0010 €E10005 driver,d 

0013 C10003 : cop,d ;COp += 

0016 600019 25,i 

0019 E10003 cop,d 

001C Cl10005 driver,d 

001F 600014 20,1 

0022 E10005 driver,d 

0025 C10003 cop,d ;while (cop < driver) 

0028 A10005 driver,d 

002B 160013 do 

002E 390003 cop, d ¡printf ("%d", cop) 

0031 00 

0032 





图 6-12 HOL6 和 Asmbs 层 的 do 语句 。 这 个 C 程序 来 自 图 2-14 


Sl 
do { S1 
S2 $2 
} cl | 
while (C1) 
$3 S3 
a) HOL6 层 的 结构 b) Asmbs 层 上 同样 的 结构 


图 6-13 图 6-12 中 do 语句 的 结构 


6.2.6 iz for 循环 
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for 语句 类 似 于 while 语句 ， 两 者 的 测试 都 是 在 循环 的 顶部， 编译 器 必须 生成 代码 来 初 
始 化 和 递增 控制 变量 。 图 6-14 展示 了 编译 器 怎样 生成 for 语句 代码 ， 它 把 for 语句 翻译 成 下 


列 的 Asmbs 层 序列 

e 初始 化 控制 变量 。 
测试 控制 变量 。 
执行 循环 体 。 
递增 控制 变量 。 
分 支 到 测试 。 


高 级 语言 


#include <stdio.h> 


int main() { 


int jy 
for (j = 0; jf < 3; j++) { 

print£("j = td\n", 35); 
} 


return 0; 


} 
汇编 语言 
0000 120003 BR 


. EQUATE 


580002 
C00000 
E30000 
A00003 
1C002A 
49002E 
3B0000 
DOOOOA 
F1FC16 
C30000 
600001 
E30000 
12000C BR 
500002 endFor: ADDSP 
00 STOP 
6A203D msg: -ASCII 
2000 


SUBSP 
LDWA 
STWA 
CPWA 
BRGE 
STRO 
DECO 
LDBA 
STBA 
LDWA 
ADDA 
STWA 


. END 


ees 
6,1 
Js 

c P i 
endFor 
msg, d 
j,s 
N\n',d 
charOut,d 
jS 
Tpi 
408 
for 
Bad 


uaa = \xo0o" 





图 6-14 HOL6 和 Asmbs 层 的 for 语句 


在 这 个 程序 中 ，CPWA 计算 (j-3 )， 如 果 N 位 为 0， 即 如 果 


也 0 


也 即 


302 
a 
303 
;local variable #2d 
;Push #j 
efor {7 = 0 
fi = 2 
¿printf ("j = td\n", j) 
304 
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j >= 3 


BRGE 分 支出 循环 。 


j 等 于 0、1 和 2 时 ,循环 体 各 执行 一 次 。 最 后 一 次 执行 后 , j 增加 到 3， 循环 终止 ， 而 


输出 语句 不 会 写 数 值 3。 


6.2.7 面条 代码 


在 汇编 层 ， 程 序 员 可 以 写 出 和 C 中 并 不 对 应 的 控 
制 结构 。 图 6-15 展示 了 一 个 可 能 的 控制 流 ， 它 在 许多 
HOL6 层 语言 中 都 不 可 能 直接 存在 。 检 测 条 件 C1， 如 果 
为 真 ， 转 移 到 一 个 测试 条 件 为 C2 的 循环 中 。 

编译 器 生成 的 汇编 语言 程序 通常 比 人 们 直接 用 汇编 
语言 写 的 程序 长 。 不 仅 如 此 ， 执 行 也 更 慢 。 如 果 程 序 员 
能 比 编译 器 写 出 更 短 更 快 的 汇编 语言 程序 ， 那 么 为 什么 
人 们 还 要 用 高 级 语言 编程 呢 ? 一 个 原因 是 如 第 5 章 讲 到 


S4 
图 6-15 在 许多 HOL6 层 语 言 中 都 
不 可 能 直接 存在 的 控制 流 


的 编译 器 进行 类 型 检查 的 能 力 ， 另 一 个 原因 是 如 果 人 允许 程序 员 自由 使 用 原始 分 支 指令 ， 这 将 
给 他 们 增加 额外 的 负担 。 如 果 在 Asmbs 层 写 程序 时 不 够 仔细 ， 分 支 指令 会 失去 控制 。 

图 6-16 的 程序 是 一 个 极端 的 例子 ， 无 限制 地 使 用 原始 分 支 指令 就 会 产生 这 些 问 题 。 由 
于 没有 注释 和 缩 进 以 及 分 支 类 型 不 一 致 ， 所 以 程序 很 难 理解 。 实 际 上 这 个 程序 执行 一 个 非常 


简单 的 任务 ， 你 能 看 出 它 是 什么 吗 ? 


120009 
0000 

0000 n2: 
0000 n3: 


310005 main: 
310007 
c10005 
A10007 
16002A 
310003 
C10003 
A10007 
160074 
120065 
E10007 
310003 
C10005 
A10003 
160053 
390003 
390005 
390007 
00 
390005 


图 6-16 一 个 神秘 的 程序 
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390007 
120081 
390003 
390005 
00 
E10003 
C10007 
A10003 
160040 
390005 
390003 
12003C 
390007 
C10003 
A10005 
160049 
12007E 
390003 
390007 
390005 
00 
390005 L8: 
390003 L9: 
00 





K 6-16 ( 续 ) 


C 中 的 让 语句 或 者 循环 体 是 一 个 语句 块 ， 有 时 它 包 含 在 用 花 括号 {} 括 起 来 的 复合 语句 
中 。 其 他 的 让 语句 和 循环 可 以 完全 婴 套 在 这 些 块 中 。 
图 6-17a 是 这 种 情形 的 示意 图 。 髓 套 在 if/else、switch、 
while, do 和 for 语句 中 的 控制 流 称 为 结构 化 控制 流 。 

这 个 神秘 程序 中 的 分 支 不 对 应 于 C 的 结构 化 控制 a 
结构 。 尽 管 对 于 执行 预期 任务 来 说 ， 这 个 程序 的 逻辑 是 C 
正确 的 ， 但 是 由 于 分 支 语句 到 处 转移 ， 因 此 程序 很 难 理 


La yy 


解 。 这 种 程序 叫 作 面条 代码 。 如 果 从 每 条 分 支 语 句 画 一 C 

人 » a N X. -da | T 

到 分 支 到 语句 的 箭头 ， 这 张 图 看 上 去 就 像 Bah = ea re 
如 图 6-17b 所 示 。 


用 非 结构 化 分 支 有 可 能 写 出 高 效 的 程序 ， 这 样 的 程 。 。 图 617 两 种 不 同类 型 的 字体 流 
序 比 用 结构 化 控制 流 的 高 级 语言 写 的 程序 执行 得 更 快 ， 
需要 的 内 存 更 少 。 有 些 特殊 的 应 用 程序 对 效率 有 特别 的 要 求 ， 可 以 直接 用 汇编 语言 来 编写 。 
理解 执行 时 间 和 内 存 占用 之 间 的 平衡 是 一 件 难事 。 当 程序 难 理解 时 ， 它 们 也 就 难 写 ， 难 
调试 ， 难 修改 。 这 是 个 经 济 问题 ， 编 写 、 调 试 、 修 改 都 是 需要 大 量 劳力 的 工作 ， 也 是 很 昂贵 
的 。 你 一 定 会 问 提高 的 这 点 效率 是 不 是 值得 花费 更 高 的 成 本 。 


6.2.8 早期 语言 的 控制 流 
在 结构 化 控制 流出 现 前 ， 计 算 机 已 经 存在 了 很 多 年 。 在 早期 没有 高 级 语言 的 时 候 ， 人 人 
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都 用 汇编 语言 编程 。 按 今天 的 标准 ， 那 时 计算 机 内 存 非 常 昂贵 ，CPU 速度 很 慢 ， 效 率 是 至 
关 重 要 的 。 由 于 还 没有 产生 大 型 软件 ， 所 以 还 没有 意识 到 程序 的 维护 问题 。 

第 一 个 广泛 应 用 的 高 级 语言 是 20 世纪 50 年 代 开 发 的 FORTRAN。 因 为 那 时 的 人 们 习惯 
使 用 分 支 指 令 ， 所 以 把 它们 也 包括 在 这 种 语言 中 。FORTRAN 中 的 无 条 件 分 支 是 

GOTO 260 
这 里 260 是 另 一 条 语句 的 语句 号 ， 称 为 goto 语句 。 条 件 分 支 是 

IF (NUMBER .GE. 100) GOTO 500 
这 里 .GE. 的 意思 是 “大 于 等 于 ”"， 这 条 语句 比较 变量 NUMBER 的 值 和 100， 如 果 大 于 等 于 
100, 那么 下 一 条 执行 的 语句 就 是 编号 500 的 语句 ， 和 否则 执行 IF 后 面 的 那 条 语句 。 

相对 于 Asmb5 层 分 支 指令 的 FORTRAN 分 支 语 句 IF 是 一 个 很 大 的 改进 ， 它 不 需要 一 个 
单独 的 比较 指令 来 设置 状态 位 。 但 是 可 以 看 到 这 个 控制 流 和 Asmb5 层 的 分 支 还 是 非常 类 似 
的 : 如 果 测 试 为 真 ， 执 行 GOTO; 否则 ， 继 续 执行 下 一 条 指令 。 

随 着 更 多 的 软件 被 开发 出 来 ， 人 们 注意 到 把 语句 组 成 块 ， 用 在 让 语句 和 循环 中 会 很 方 
便 。 在 这 方面 取得 进步 最 著名 的 是 1960 年 开发 的 Algol 60， 这 是 第 一 个 广泛 应 用 块 结构 的 
语言 ， 尽 管 它 主 要 在 欧洲 流行 。 


6.2.9 结构 化 编程 定律 


前 几 节 展示 了 高 级 语言 结构 化 控制 语句 怎样 被 翻译 为 低层 的 原始 分 支 语句 ， 同 时 也 展示 
了 怎样 在 低层 写 出 没有 对 应 结构 化 结构 的 分 支 。 这 提出 了 一 个 有 趣 而 实际 的 问题 : 可 以 用 
goto 语句 写 出 一 些 算法 ， 用 于 执行 结构 化 结构 不 能 执行 的 处 理 吗 ? 也 就 是 说 ， 如 果 限 定 使 用 
结构 化 控制 流 ， 会 有 一 些 问题 你 无 法 解决 ， 而 如 果 人 允许 使 用 非 结 构 化 的 goto， 这 些 问题 就 可 
以 解决 吗 ? 

1966 年 ，Corrado Bohm 和 Giuseppe Jacopini 在 一 篇 计算 机 科学 杂志 文章 中 回答 了 这 个 
问题 ” 。 他 们 从 数学 上 证 明了 任何 含有 goto 语句 的 算法 ， 不 管 多 么 复杂 多 么 无 结构 ， 都 可 以 
HREH if HAAN while 循环 来 编写 。 他 们 的 结论 称 为 结构 化 编程 定律 。 

Bohm 和 Jacopini 的 论文 高 度 理论 化 ， 起 初 没有 引起 太 多 的 关注 ， 因 为 程序 员 通 常 不 希 
望 限制 他 们 使 用 goto 语句 的 自由 。Bohm 和 Jacopini 展示 了 用 让 语句 和 while 循环 可 以 做 什 
么 ,但 是 没有 回答 为 什么 程序 员 要 这 样 限制 自己 。 

不 管 怎 样 ， 人 们 开始 尝试 这 个 理念 。 他 们 会 拿 一 个 面条 代码 算法 ， 试 着 用 不 带 goto i 
句 的 结构 化 控制 流 来 重 写 它 。 通 常 新 写 的 程序 比 原来 的 更 清晰 ,偶尔 甚 至 更 高 效 。 


6.2.10 goto 争论 


Bohm 和 Jacopini 的 论文 发 表 两 年 后 ， 和 荷兰 埃 因 霍 温 理工 大 学 的 Edsger W. Dijkstra 给 同 
一 家 杂志 的 编辑 写 信 ， 信 中 阐述 了 他 个 人 的 观察 .优秀 的 程序 员 比 差劲 的 程序 员 更 少 使 用 
goto if), © 


© Corrado Bohm and Giuseppe Jacopini, “ Flow-Diagrams, Turing Machines and Languages with Only Two Formation 
Rules,” Communications of the ACM 9 (May 1966): 366-371. 

© Edsger W. Dijkstra, “ Goto Statement Considered Harmful,” Communications of the ACM 11 (March 1968): 147- 
648. 
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他 的 观点 是 ， 程 序 中 大 量 使 用 goto 语句 表示 质量 很 低 。 部 分 原文 如 下 : 

最 近 ， 我 发 现 了 为 什么 goto 语句 的 使 用 有 极其 糟 糙 的 影响 ， 因 此 我 确信 应 该 从 所 有 高 
级 编程 语言 ( 即 任何 语言 ， 也 许 除了 纯 机 器 代码 外 ) 中 废除 goto 语句 …… goto 语句 所 处 的 位 
置 大 原始 ， 太 容易 把 程序 搞 得 一 团 糟 。 

为 了 证 明 这 些 观 点 ，Dijkstra 开发 了 用 一 套 坐 标 来 描述 程序 进展 的 理念 。 当 人 们 想 理解 
一 个 程序 时 ， 他 必须 在 心理 上 ， 或许 是 无 意识 地 ,维护 这 套 坐 标 。Dijkstra 展示 了 用 结构 化 
控制 流 比 用 非 结 构 化 goto 语句 维护 这 些 坐 标 要 简单 得 多 ， 因 此 他 能 精确 指出 结构 化 控制 流 
更 容易 理解 的 原因 。 

Dijkstra 知道 废除 goto 语句 这 个 理念 并 不 新 鲜 ， 他 提 到 了 在 这 件 事情 上 影响 他 的 几 个 
人 ， 其 中 之 一 是 致力 于 Algol 60 语言 的 Niklaus Wirth. 

Dijkstra 的 信 引 起 了 一 场 反对 风暴 ， 这 就 是 现在 著名 的 goto 争论 。 理 论 上 可 以 不 用 goto 
编程 是 一 回 事 , 但 主张 从 FORTRAN 这 样 的 高 级 语言 中 废除 goto 完全 是 另外 一 回 事 。 

旧 的 观念 很 难 消失 ， 不 管 怎样 争论 逐渐 平息 了 。 现 在 一 般 认为 Dijkstra 实际 上 是 正确 
的 。 原 因 是 成 本 。 当 软件 经 理 开始 和 其 他 结构 设计 概念 一 起 运用 结构 化 控制 流 准 则 时 ,他 
们 发 现 这 样 的 软件 开发 、 调 试 和 维护 花费 很 低 ， 这 使 得 额外 的 内 存 需求 和 执行 时 间 变 得 有 
价值 。 

FORTRAN 77 是 在 1977 年 制定 的 一 个 更 新 的 FORTRAN 版 本 ，goto 争论 影响 到 了 它 的 
设计 。 它 的 块 风格 和 带 ELSE 部 分 的 IF 语句 都 类 似 于 C， 例 如 ， 

IF (NUMBER .GE. 100) THEN 

语句 1 

ELSE 

语句 2 

ENDIF 
我 们 可 以 用 FORTRAN 77 编写 没有 goto 的 IF 语句 。 

要 记 住 ,程序 中 不 用 goto 不 能 保证 程序 有 好 的 结构 。 在 只 需要 1 个 或 者 2 个 垦 套 时 ， 
有 可 能 写 册 有 3 或 4 个 让 语句 和 while 循环 柑 套 的 程序 。 此 外 ， 如 果 任 何 层 上 的 语言 只 包含 
goto 语句 来 改变 控制 流 ， 它 也 可 以 总 是 以 结构 化 的 方式 来 实现 让 语句 和 while 循环 。 这 正 是 
C 编译 器 把 程序 从 HOL6 层 翻 译 到 Asmb5 层 时 做 的 事情 。 


6.3 函数 调用 和 参数 


C 函数 调用 把 控制 流 改变 到 了 函数 的 第 一 条 可 执行 语句 ， 在 函数 结束 时 ， 控 制 回 到 函数 
调用 下 面 的 语句 。 编 译 器 用 CALL 指令 实现 函数 调用 ，CALL 指令 有 在 运行 时 栈 存储 返回 地 
址 的 机 制 。 它 用 RET 实现 返回 到 调用 语句 ，RET 用 保存 在 运行 时 栈 的 返回 地 址 来 确定 接 下 
来 执行 哪 条 指令 。 


6.3.1 翻译 函数 调用 


图 6-18 展示 了 编译 器 如 何 翻 译 不 带 参 数 的 函数 调用 ， 程 序 输出 3 个 星 号 三 角形 。 
CALL 指令 把 程序 计数 器 的 内 容 压 人 运行 时 栈 ， 然 后 把 操作 数 装 人 程序 计数 器 。CALL 
EAH RTL 描述 是 : 
SP — SP-2; Mem[SP] «— PC; PC + Oprnd 
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高 级 语言 


#include <stdio.h> 


void printTri() { 
printf ("*\n") ; 
printf ("**\n") ; 
printf ("***\n") ; 
printf ("***«\n") ; 


} 


int main() { 


printTri (); 


printTri () ; 


printTri () ; 


return 0; 


} 


汇编 语言 
0000 120019 


49000D 
490010 
490014 
o1 
2A0A00 
2A2A0A 
00 
2A2A2A 
0A00 


240003 
240003 
240003 
00 


i 
peek Re 


printTri: 


RRR RE RE 


main: 


BR 


main 


void printTri () 


STRO 
STRO 
STRO 
RET 
-ASCII 
-ASCIT 


-ASCIT 


msgl,d 
msg2,d 
msg3,qa 


"#\n\x00" 
kee \n\x0 0" 


nee \n\x00" 


int main() 


CALL 
CALL 
CALL 
STOP 
. END 


printTri 
printTri 
printTri 





;printf ("*\n") 
¿printf ("**\n") 
printf ("***\n") 


;printTri () 
;printTri () 
j;printTri () 


图 6-18 HOL6 层 和 Asmb5 层 的 过 程 调用 
实际 上 ， 这 个 过 程 调用 的 返回 地 址 被 压 人 栈 ， 然 后 执行 一 个 到 该 过 程 的 分 支 。 


和 分 支 指令 一 样 ，CALL 通常 使 用 立即 数 寻 址 方式 执行 ， 


这 种 情况 下 操作 数 就 是 操作 数 


指示 符 。 如 果 不 指定 寻 址 方式 ，Pep/9 汇编 程序 将 假设 使 用 立即 数 寻 址 。 


RET 的 RTL 描述 是 : 


PC +— Mem[SP]; SP+— SP+2 


指令 把 返回 地 址 从 运行 时 栈 顶 部 移 到 程序 计数 器 。 然 后 ， 给 栈 指针 加 2， 这 是 出 栈 操作 。 


在 图 6-18 中 ， 


0000 120019 BR main 


把 0019 放 人 程序 计数 器 ， 因 此 下 一 条 要 执行 的 语句 是 在 0019 的 语句 ， 即 第 一 条 CALL 指 
令 。 对 图 6-1 中 程序 的 讨论 解释 了 栈 指针 怎样 初始 化 为 FB8F。 图 6-19 展示 了 执行 第 一 条 
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CALL 语句 之 前 和 之 后 的 运行 时 栈 。 通 常 ， 栈 指针 的 初始 值 是 FB8F。 


PC FBSD PC FBSD 
sp FBSF sp rer [| 
a) 第 一 条 CALL 执行 前 b) 第 一 条 CALL 执行 后 


图 6-19 图 6-18 中 第 一 条 CALL 指令 的 执行 


CALL 和 RET 的 运行 严重 依赖 于 冯 “' 诺 依 曼 运 行 周期 : 取 指 、 译 码 、 增 加 PC、 执 行 和 
重复 ， 特 别 是 增加 PC 发 生 在 执行 前 ， 结 果 就 是 正在 执行 的 语句 并 不 是 地 址 在 程序 计数 器 中 
的 语句 ， 而 是 程序 计数 器 增加 前 取出 的 那 条 语句 ， 现 在 它 放 在 指令 寄存 器 中 。 这 个 为 什么 在 
CALL 和 RET 的 执行 中 非常 重要 呢 ? 

图 6-19a 显示 了 在 第 一 条 CALL 指令 执行 前 ， 程 序 计 数 器 的 内 容 为 001C， 这 不 是 第 一 
条 CALL 指令 的 地 址 ， 第 一 条 CALL 指令 的 地 址 是 0019。 为 什么 不 是 呢 ? 因为 程序 计数 器 
在 执行 CALL 前 增加 到 了 001C， 因 此 在 执行 第 一 条 CALL 指令 期 间 ， 程 序 计数 器 包含 的 正 
好 是 位 于 CALL 指令 后 面 那 条 指令 在 主 存 中 的 地 址 。 

第 一 条 CALL 指令 执行 时 发 生 了 什么 呢 ?” 首 先 ，SP 和 一 SP - 2 对 SP 减 2， 得 到 值 FB8D。 
其 次 Mem[SP] 二 PC 把 程序 计数 器 的 值 001C 放 入 主 存 中 地 址 FB8D 的 位 置 ， 即 运行 时 栈 顶 
部 。 最 后 PC < Oprnd 把 0003 放 入 程序 计数 器 。 因 为 操作 数 指示 符 是 0003 ， 寻 址 方式 是 立 
即 数 寻 址 ， 所 以 结果 如 图 6-19b 所 示 。 

Ty > 诺 依 曼 周期 继续 下 一 个 取 指 。 但 是 现在 程序 计数 器 中 是 0003， 因 此 下 一 个 要 获取 
的 指令 是 地 址 0003 的 指令 ， 这 是 printTri 程序 的 第 一 条 指令 ， 执 行 过 程 的 输出 指令 ， 生 成 
一 个 星 号 三 角 图 案 。 

最 后 ， 地 址 000C 的 RET 指令 执行 。 图 6-20a 显示 在 执行 RET 之 前 程序 计数 器 的 内 
容 是 000D， 这 可 能 看 上 去 有 点 儿 奇 怪 ， 因 为 000D 甚至 不 是 一 条 指令 的 地 址 ， 它 是 字符 串 
“*\x00” 的 地 址 。 为 什么 会 这 样 呢 ” 因 为 RET 是 一 个 一 元 指令 ，CPU 会 把 程序 计数 器 加 1。 
执行 RET 的 第 一 步 是 Mem[SP] — PC 把 001C 放 入 程序 计数 器 。 然 后 ，SP SP + 2 把 栈 指 
针 改变 回 FB8F。 


pc [6005] resp [ooie] re foc] rasp [oo 
sp [Fso] roar [| se [m] e 


a) 第 一 次 RET 执行 前 b) 第 一 次 RET 执行 后 
6-20 ”第 一 次 执行 图 6-18 中 的 RET 指令 


冯 : 诺 依 曼 周 期 继续 下 一 个 取 指 ,但 这 时 程序 计数 器 包含 第 二 条 CALL 指令 的 地 址 ， 发 
生 和 第 一 个 调用 一 样 的 事件 序列 ， 在 输出 流 生成 男 一 个 星 号 三 角 图 案 。 第 三 个 调用 也 是 一 样 
的 情况 ， 这 之 后 执行 STOP 指令 。 注 意 在 STOP 指令 执行 后 ,程序 计数 器 的 值 是 0023 而 不 
Æ 0022, 0023 是 STOP 指令 的 地 址 。 

现在 你 应 该 明白 汉 : 诺 依 曼 周期 中 为 什么 PC 增加 在 执行 之 前 了 吧 。 要 在 运行 时 栈 存储 
返回 地 址 ，CALL 指令 需要 存储 CALL 后 面 那 条 指令 的 地 址 。 只 有 CALL 语句 执行 前 程序 计 
数 器 已 经 增加 了 才能 做 到 这 一 点 。 
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6.3.2 ”用 全 局 变量 翻译 传 值 调用 参数 


在 C 中 调用 一 个 空 函 数 时 ， 分 配 过 程 是 

e KALE. 

e 压 人 返回 地 址 。 

o 压 人 局 部 变量 的 存储 空间 。 

在 HOL6 层 ,在 栈 上 执行 这 些 操作 的 指令 是 隐藏 的 。 程 序 员 只 写 函 数 调 用 ， 执 行 时 栈 分 
配 自动 进行 。 

然而 ， 在 汇编 层 ， 翻 译 后 的 程序 必须 要 有 明确 的 指令 来 完成 这 些 压 栈 操作 。 图 6-21 的 
程序 和 图 2-16 的 程序 一 样 ， 是 一 个 输出 柱状 图 的 HOL6 层 程序 ， 以 及 它 对 应 的 Asmb5 层 
翻译 程序 。 图 中 显示 了 压 人 参数 必需 的 Asmb5 层 语 句 ， 而 在 HOL6 层 是 不 需要 明确 写 出 
来 的 。 


高 级 语言 


#include <stdio.h> 


int numPts; 
int value; 
int. j; 


void printBar (int n) { 
int k; 
for (k = 1; k <= n; k+) { 
print£("*") ; 
} 
print£("\n"); 


} 


int main() { 
scanf("%d", &numPts) ; 
for (j = 1; j <= numPts; j++) 
scanf ("$d", &value) ; 
printBar (value) ; 


} 


return 0; 


} 


汇编 语言 

0000 120034 BR main 

0003 0000 numPts: .BLOCK 2 ;global variable #2d 
0005 0000 value: -BLOCK 2 ;global variable #2d 
0007 0000 js .BLOCK 2 ;global variable #2d 


p*e*eeee*e void printBar(int n) 

n: . EQUATE 4 ;formal parameter #2d 

k: . EQUATE 0 ;local variable #2d 
580002 printBar:SUBSP 2,i ;push #k 
C00001 LDWA lad stoy (k 
E30000 STWA k, 





图 6-21 全 局 变量 作为 传 值 调用 参数 。C 程序 来 自 图 2-16 


A30004 forl: 
1E002A 
DOOO2A 
F1FC16 
C30000 
600001 
E30000 
120012 
DOOOOA endForl1: 
F1FC16 
500002 
01 
pReeeeeE 
310003 main: 
C00001 
E10007 
A10003 for2: 
1E0061 
310005 
c10005 
E3FFFE 
580002 
240009 
500002 
C10007 
600001 
E10007 
12003D 
00 endFor2: 


n,s 
endForl 
Vet S 

charOut,d 

k,s 

= re 

kis 

forl 
"a,i 

charOut,d 

24 


numPts,d 
L 

Jra 
numPts,d 
endFor2 
value,d 
value,d 
-2,8 

2,2, 
printBar 
2, 3, 

Jd 

Tå 

ja 

for2 





图 6-21 (48) 
main() 中 的 调用 过 程 负 责 压 人 实 参 以 及 执行 CALL，CALL 把 返回 地 址 压 和 人 栈 。 


printBar() 中 的 被 调用 过 程 负责 在 栈 上 给 局 部 变量 分 配 存 储 空间 。 被 调用 的 过 程 执行 后 ， 必 
须 释 放 局 部 变量 的 存储 空间 ， 通 过 执行 RET 弹出 返回 地 址 。 在 调用 过 程 可 以 继续 之 前 ， 一 


总 的 来 说 ， 调 用 和 被 调用 过 程 会 完成 如 下 操作 : 


e 调用 者 压 人 实 参 (执行 SUBSP). 
e 调用 者 压 人 返回 地 址 (执行 CALL ) 。 


© 被 调用 者 为 局 部 变量 分 配 存储 空间 (执行 SUBSP). 


© 被 调用 者 执行 函数 体 。 


e 被 调用 者 弹出 局 部 变量 (执行 ADDSP). 


e 被 调用 者 弹出 返回 地 址 (执行 RET). 
e 被 调用 者 弹出 实 参 (执行 ADDSP). 
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pprint£é ("*") 


k++) 


;printf("\n") 


;pop #k 


;scanf("%td", &numPts) 
itor g = 2 


;j <= numPts 


;scanf("%td", &value) 
;move value 


;push #n 
;printBar (value) 
jpop #n 


2j++) 


注意 这 些 操 作 的 对 称 性 ， 后 三 个 操作 以 相反 的 顺序 执行 前 3 个 操作 的 逆 操 作 ， 这 个 顺序 


是 栈 的 后 进 先 出 特性 导致 的 。 
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HOL6 层 主 程序 的 全 局 变量 (numPts, value 和 j ) 对 应 同样 的 Asmb5 层 符号 ， 符 号 值 分 
别 是 0003、0005 和 0007， 这 是 保存 全 局 变量 运行 时 值 的 内 存单 元 地 址 。 图 6-22a 显示 了 全 
局 变量 ,左边 原来 写 地 址 的 地 方 现在 写 的 是 符号 名 。 全 局 变量 的 值 是 第 一 次 执行 如 下 语句 之 
后 的 值 : 


scanf ("%d", &value); 





numPts numPts 
value value fetAddr 
SP e> 7 
a) 执行 scanf (“%d”, &value) 后 b) 执行 printfBar (value) 后 


图 6-22 ”全 局 变量 作为 传 值 调用 参数 


形 参 n 和 局 部 变量 k 在 AsmbS 层 对 应 的 是 什么 呢 ? 不 是 绝对 地 址 而 是 栈 相对 地 址 。 过 
程 printBar 用 

n: .EQUATE 4 ;formal parameter #2d 

k: .EQUATE 0 ;local variable #2d 
来 定义 它们 。 记 住 EQUATE 不 会 生成 目标 代码 ， 翻 译 时 汇编 器 不 给 它们 保留 存储 空间 ， 而 
是 在 运行 时 在 栈 上 为 n 和 kk 分 配 存储 空间 。 十 进 制 数 4 和 0 是 过 程 执行 期 间 n 和 k 的 栈 偏 移 
量 ， 如 图 6-22b 所 示 。 过 程 以 栈 相对 寻 址 方式 来 引用 它们 。 

调用 过 程 中 与 过 程 调用 相对 应 的 语句 为 

0046 C10005 LDWA value,d 

0049 E3FFFE STWA =2,8 


004C 580002 SUBSP 2,i ;push #n 
004F 240009 CALL printBar ;printBar(value) 
0052 500002 ADDSP 2,i ;pop #n 


因为 参数 是 传 值 调用 的 全 局 变量 ， 所 以 LDWA 用 直接 寻 址 ， 它 把 变量 value 的 运行 时 
值 放 人 累加 器 ， 接 着 STWA 把 它 压 入 栈 。 偏 移 量 是 -2 ， 因 为 value 是 一 个 2 字 节 的 整数 量 ， 
如 图 6-22a 所 示 。 

被 调用 过 程 中 与 过 程 调用 相对 应 的 语句 为 


0009 580002 printBar:SUBSP 2,i ;push #k 


0030 500002 ADDSP 2,i ;pop #k 

0033 01 RET 

由 于 局 部 变量 k 是 2 字 节 的 整数 量 ， 所 以 SUBSP 减 去 2。 图 6-22a 展示 了 第 一 次 输入 
全 局 变量 value 后 、 第 一 次 过 程 调 用 前 的 运行 时 栈 ， 它 直接 对 应 于 图 2-17d。 图 6-22b 展示 
了 过 程 调用 后 的 栈 . 直接 对 应 于 图 2-17g。 注意 在 图 2-17 中 标 为 ral 的 返回 地 址 ， 这 里 为 
0052， 是 跟 在 CALL 后 面 那 条 指令 的 机 器 语言 地 址 。 

n 的 栈 地 址 是 4， 因 为 返回 地 址 和 k 都 占用 2 字 节 。 如 果 有 更 多 的 局 部 变量 ， 那 么 n 的 
栈 地 址 会 相应 地 更 大 。 编 译 器 必须 根据 栈 上 数据 的 数量 和 大 小 来 计算 栈 地址。 

总 之 ， 要 用 全 局 变量 翻译 传 值 调用 参数 ， 编 译 器 以 如 下 方式 生成 代码 : 
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。 生成 采用 直接 寻 址 方式 的 装 入 指令 ， 压 人 调用 者 的 实 参 。 
。 生成 采用 栈 相 对 寻 址 方式 的 装 和 指令 ， 压 人 被 调用 者 的 形 参 。 


6.3.3 ”用 局 部 变量 翻译 传 值 调 用 参数 


除了 main) 的 变量 是 局 部 变量 而 不 是 全 局 变量 之 外 ， 图 6-23 的 程序 和 图 6-21 的 程序 是 
完全 一 样 的 。 尽 管 这 个 程序 的 行为 很 像 图 6-21 的 程序 ， 但 是 内 存 模 型 和 到 Asmb5 层 的 翻译 
是 不 同 的 。 

高 级 语言 


#include <stdio.h> 


void printBar(int n) { 
int k; 
for (k = 1; k <= n; k++) { 
printé("*"); 
} 
printf ("\n"); 


} 


int main() { 

int numPts; 

int value; 

int jz 

scanf("%d", &numPts) ; 

for (j = 1; j <= numPts; j++) { 
scanf("%d", &value); 
printBar (value) ; 


} 


return 0; 


} 
汇编 语言 
0000 12002E BR main 


peewee void printBar(int n) 
n: .EQUATE 4 ;formal parameter #2d 
k: -EQUATE 0 ;local variable #2d 
580002 printBar:SUBSP 2,2 ;push #k 
C00001 LDWA 1,2 ;for (k =1 
E30000 STWA k,s 
A30004 CPWA n,s ik <= n 
1E0024 BRGT endFor1 
D0002A LDBA tti printf ("*") 
F1FC16 STBA charOut,d 
C30000 LDWA k,s k++) 
600001 RADDA ANER: 3 
E30000 STWA k,s 
12000C BR forl 
DOOOOA LDBA Ey: UPE ;printé ("\n") 
F1FC16 STBA charOut,d 





图 6-23 局 部 变量 作为 传 值 调用 参数 


317 
2 
319 
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500002 ADDSP 
01 RET 


i 


pReeeeee main () 


numPts: .EQUATE 4 ;local variable #2d 
value: -EQUATE 2 ;local variable #2d 
j: . EQUATE 0 ;local variable #2d 
580006 main: SUBSP 6,i ;push #numPts #value #3 
330004 DECI numPts,s ;scanf("%d", &numPts) 
C00001 LDWA Lk ;for (j = 1 
E30000 STWA j,s 
A30004 CPWA numPts,s ;j <= numPts 
1E005E BRGT endFor2 
330002 DECI value,s ;scanf("%d", &value) 
C30002 LDWA value,s ;move value 
E3FFFE STWA -2,8 
580002 SUBSP 2k ;push #n 
240003 CALL printBar ;printBar (value) 
500002 ADDSP 2,4 pop #n 
c30000 LDWA | j++) 
600001 ADDA Iri 
E30000 STWA j,s 
12003A BR for2 
500006 endFor2: ADDSP 6,i ;pop #j #value #numPts 
00 STOP 
. END 





图 6-23 (48) 


可 以 看 到 图 6-21 和 图 6-23 中 的 返回 值 为 void (2) 的 函数 printBar() 在 HOL6 层 是 一 
样 的 ， 因 此 编译 器 为 这 两 个 版 本 生成 一 样 的 Asmb5 层 目 标 代 码 并 不 奇怪 。 两 个 程序 唯一 
的 不 同 是 main) 的 定义 。 图 6-24a 展示 了 主 程序 中 numPts、value 和 j 在 运行 时 栈 上 的 分 
配 。 图 6-24b 展示 了 printTri 第 一 次 被 调用 后 的 运行 时 栈 。 因 为 value 是 一 个 局 部 变量 ， 所 
以 编译 器 生成 使 用 栈 相 对 寻 址 方式 的 LDWA value，s， 将 value 的 实际 值 压 人 形 参 n 的 栈 
单元 。 


Value 


numPts 





a) 执行 scanf (“%d”", &value) 后 b) 执行 printfBar (value) 后 
图 6-24 图 6-23 中 函数 调用 的 第 一 次 执行 
BZ, 为 了 用 局 部 变量 翻译 传 值 调用 参数 ,编译 器 以 如 下 方式 生成 代码 : 


© 生成 使 用 栈 相对 寻 址 方式 的 装 和 指令， 压 人 调用 者 的 实 参 。 
。 生成 使 用 栈 相对 寻 址 方式 的 装 和 人 指令 ， 压 人 被 调用 者 的 形 参 。 
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6.3.4 翻译 非 空 函数 调用 


调用 函数 时 ,分配 过 程 是 这 样 的 : 

e 为 返回 值 分 配 存储 空间 。 

e KALE, 

e 压 人 返回 地 址 。 

e 为 局 部 变量 分 配 存储 空间 。 

非 空 (non-void) 函数 调用 的 分 配 不 同 于 过 程 ( 空 函数 ) 调用 的 分 配 ， 必 须 为 返回 的 函数 
值 分 配额 外 的 空间 。 

图 6-25 展示 了 一 个 递归 计算 二 项 式 系数 的 程序 ， 和 图 2-28 的 程序 一 样 。 它 是 基于 系数 
的 帕斯卡 三 角 ， 如 图 2-27 所 示 。 二 项 式 系数 的 递归 定义 是 


1 k=0 
b(n,k)=41 n=k 
b(n-Lk)+b(n-Lk-1) O0<k<n 


高 级 语言 


#include <stdio.h> 


int binCoeff(int n, int k) { 
int yl, y2; 
if (tk == 0) || (a == K)? { 
return 1; 
} 
else { 
yl = binCoeff(n - 1, k); // ra2 
y2 = binCoeff(n - 1, k - 1); // ra3 
return yl + y2; 
} 
} 


int main() { 
printf ("binCoeff (3, 1) = d\n", binCoeff (3, 1)); // ral 
return 0; 


} 


汇编 语言 
0000 12006B BR main 


j**eeeeee int binomCoeff (int n, int k) 
retVal: .EQUATE ;return value #2d 
n: . EQUATE ;formal parameter #2d 
. EQUATE ;formal parameter #2d 
yl: . EQUATE ;local variable #2d 
y2: . EQUATE ;local variable #2d 
580004 binCoeff:SUBSP i ;push #yl #y2 
C30006 if: LDWA x sll ((k == 0) 
180015 BREQ 
c30008 LDWA ; (n == k)) 


图 6-25 HOLS Je fil AsmbS 层 的 递归 非 空 函 数 。 这 个 C 程序 来 自 图 2-28 
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A30006 k,s 

1A001F else 

C00001I e ;return 1 

E3000A retVal,s 

500004 4,i jpop #y2 #y1 

01 

C30008 n,s ymove n - 1 

700001 Lyt 

E3FFFC -4,8 

C30006 k,s ;move k 

E3FFFA -6;8 

580006 6,1 ;push #retVal #n #k 

240003 binCoeff ;binCoeff(n - 1, k) 

500006 6,1 ;pop #k #n #retVal 

C3FFFE -2,s ;yl = binomCoeff(n - 1, k) 
(321) E30002 STWA yl,s 


c30008 n,s ;move n - 1 

700001 SUBA Tyi 

E3FFFC STWA -4,8 

C30006 k,s ;move k - 1 

700001 SUBA Law 

E3FFFA STWA -6,S 

580006 SUBSP 6,i ;push #retVal #n #k 


240003 CALL binCoeff ;binomCoeff(n - 1, k - 1) 
500006 š ADDSP 6,i ;pop #k #n #retVal 
C3FFFE LDWA -2,8 ;y2 = binomCoeff(n - 1, k - 1) 
E30000 STWA y2,s 
C30002 LDWA yi,s ;return yl + y2 
630000 ADDA y2,s 
E3000A STWA retVal,s 
500004 RDDSP 4,i ;pop #y2 #y1 
ol RET 
i 
;*ž*x*ž*x*x** main () 
49008D main: STRO msg,d ;printf ("binCoeff (3, 1) = %d\n", 
C00003 LDWA Fà ¡move 3 
E3FFFC STWA -4,S 
C00001 LDWA Lat ;move 1 
E3FFFA STWA -6,8 
580006 SUBSP 6,i ;push #retVal #n #k 
240003 CALL binCoeff ;binCoeff(3, 1) 
500006 : ADDSP 6,i ;pop #k #n #retVal 
3BFFFE DECO -2,9 
DOOOOA LDBA "nal, 2 
F1FC16 STBA charOut,d 
00 
62696E msg: "binCoeff£(3, 1) = \x00" 


322 





6-25 ( 续 ) 
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函数 使 用 让 语句 来 测试 基本 的 情况 ,测试 条 件 使 用 了 布尔 运算 符 OR。 如 果 基 本 情况 都 
不 符合 ， 它 会 递归 调用 自己 两 次 一 一 一 次 计算 b(n-1, 各， 一 次 计算 b(n-1, k-1)。 图 2-29 展 
示 了 主 程序 中 一 个 以 实 参 (3,1) 调用 产生 的 运行 时 栈 。 函 数 接 下 来 会 被 再 调用 两 次 ， 参 
数 分 别 是 (2, 1) 和 (1, 1)， 然 后 返回 。 再 执行 参数 为 (1, 0 ) 的 调用 ， 接 着 是 第 二 次 返 
回 ， 以 此 类 推 。 图 6-26 展示 了 第 二 次 返回 后 汇编 层 的 运行 时 栈 ， 它 正好 对 应 于 图 2-29g 的 
HOL6 层 示意 图 。 图 2-29g 中 标号 为 ra2 的 返回 地 址 在 图 6-26 中 是 0034， 这 是 函数 中 第 一 
次 CALL 后 面 指令 的 地 址 。 类 似 地 ， 图 2-29 中 标 
号 为 ral 的 地 址 在 图 6-26 中 是 0080。 

主 程序 开始 时 ， 栈 指针 是 初始 值 ， 第 一 个 
实 参 的 栈 偏 移 量 是 -4， 第 二 个 实 参 的 栈 偏 移 量 
是 -6。 如 果 是 在 一 个 过 程 调用 (返回 值 为 空 的 函 
数 ) 中 ， 两 个 实 参 的 偏 移 量 分 别 是 -2 和 -4。 它 们 
比 前面 对 应 的 偏 移 量 大 2， 因 为 这 个 函数 的 返回 
值 会 在 运行 时 栈 上 占 2 字 节 。007A 的 SUBSP 指 
令 分 配 6 字 节 ， 两 个 实 参 每 个 2 字 节 ， 返 回 值 2 
字 节 。 

当 函 数 将 控制 返回 到 0080 的 ADDSP Ht, PA 
数 的 返回 值 位 于 栈 上 两 个 实 参 的 下 面 。ADDSP 给 
栈 指针 加 6， 弹出 两 个 实 参 和 返回 值 ， 于 是 指针 
指向 返回 值 下 面 的 那个 单元 。 这 样 DECO 用 栈 相 626 第 二 次 返回 后 图 6-25 的 运行 时 楼 
对 寻 址 方式 输出 这 个 值 ， 使 用 偏 移 量 -2。 

这 个 函数 按照 标准 技术 通过 分 配 实 参 来 调用 它 自己 。 对 于 第 一 次 递归 调用 ， 它 计算 n-1 
和 上 大， 把 这 两 个 值 和 返回 值 的 存储 空间 一 起 压 和 人 栈 。 返 回 后 ， 序 列 

0034 500006 ra2: ADDSP 6,i ;pop #k #n #retVal 

0037 C3FFFE LDWA -2,S j;yl = binomCoeff(n - 1, k) 

003A E30002 STWA yl,s 
弹出 两 个 实 参 和 返回 值 ， 将 返回 值 赋 给 yl1。 对 于 第 二 次 调用 ， 类 似 地 把 n-1 和 kl 压 入 ， 
把 返回 值 赋 给 y2。 


6.3.5 ”用 全 局 变量 翻译 传 引用 调用 参数 


C 提供 传 引用 调用 参数 ， 这 样 被 调用 过 程 可 以 改变 调用 过 程 中 实 参 的 值 。 图 2-20 eas [323 
了 一 个 HOL6 层 的 程序 ， 使 用 传 引用 调用 对 两 个 全 局 变量 a 和 b 排序 。 图 6-27 给 出 了 这 个 
程序 ， 以 及 编译 器 产生 的 目标 程序 。 


高 级 语言 


#include <stdio.h> 





int a, b; 


void swap(int *r, int *s) { 


int temp; 





图 6-27 全 局 变量 作为 传 引 用 调用 参数 。C 程序 来 自 图 2-20 


212 BORD LBA (FSA) 


void order(int *x, int *y) { 
if (*x > *y) { 
swap(x, y); 


} 2 wae 


int main() { 
printf ("Enter an integer: 
scanf ("%d", &a); 
printf ("Enter an integer: 
scanf("%d", &b); 
order (&a, &b); 
printf ("Ordered they are: %d, %d\n", a, b); // ral 
return 0; 


} 
汇编 语言 
0000 12003F BR 
0003 0000 a: . BLOCK ;global variable #2d 
0005 0000 b: .BLOCK ;global variable #2d 
j****e*** Void swap(int *r, int *s) 
. EQUATE 6 ;formal parameter #2h 
.EQUATE 4 ;formal parameter #2h 
.EQUATE 0 ;local variable #2d 
580002 SUBSP 2,i ;push #temp 
C40006 LDWA TBE ¡temp = *r 
E30000 STWA temp, S 
c40004 LDWA s,sf 7*k *s 
E40006 r,sf 
C30000 temp,s ;7*S temp 
E40004 s,sf 
500002 2,1 ;pop #temp 
01 
peeeeeee void order (int *x, int *y) 
.EQUATE 4 ;formal parameter #2h 
. EQUATE 2 ;formal parameter #2h 
C40004 LDWA x, BE iif (*x > *y) 
A40002 CPWA y, st 
14003E BRLE endIf 
C30004 LDWA x,s ;move x 
E3FFFE STWA -2,8 
C30002 LDWA Ys ¡move y 
E3FFFC STWA -4,S 
580004 SUBSP 4,i ;Push #r #s 


图 6-27 ( 续 ) 
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240007 CALL ;Swap (x, y) 
500004 ADDSP ;pop #s #r 
oi endIf: RET 


7 RRR a EN main() 
490073 main: STRO msgl,d ¡printf ("Enter an integer: 
310003 DECI a,d ¡scanf ("%d", &a) 
490073 STRO msgl,d ;printf ("Enter an integer: 
310005 DECI b,d ;scanf("%sd", &b) 
C00003 LDWA a,i ;move &a 
E3FFFE STWA =248 
C00005 LDWA i a PE ;move &b 
E3FFFC STWA -4,85 
580004 SUBSP 4,i ;push #x #y 
240020 CALL order jorder (&a, &b) 
500004 ral: ADDSP 4,i ¡pop #y #x 
490086 STRO msg2,d ;printf ("Ordered they are: %d, %d\n" 
390003 DECO a,d 
490099 STRO msg3,d 
390005 DECO b,d 
DOOOOA LDBA What ol 
F1FC16 STBA charOut,d 
00 STOP 
456E74 msgl: -ASCII "Enter an integer: \x00" 


4F7264 msg2 : -ASCII "Ordered they are: \x00" 


2C2000 msg3: sASCII ", \x00" 
. END 





图 6-27 ( 续 ) 


C 的 传 引用 调用 参数 不 同 于 传 值 调 用 参数 ， 因 为 在 调用 过 程 中 实 参 提供 的 是 变量 的 引用 
而 不 是 变量 的 值 。 在 汇编 层 ， 把 实 参 压 人 栈 的 代码 会 把 实 参 的 地 址 压 人 ， 对 应 于 参数 列表 中 
的 & 地 址 运算 符 。 当 实 参 为 全 局 变量 时 ， 它 的 地 址 就 是 它 符号 的 值 。 这 样 压 人 全 局 变量 地 
址 的 代码 就 是 一 个 使 用 立即 数 寻 址 的 装 入 指令。 在 图 6-27 中 ， 获 得 a 的 地 址 的 代码 是 


004B C00003 LDWA a,i ;move &a 


符号 a 的 值 是 0003， 这 是 a 的 值 存储 的 地 址 。 这 个 指令 的 机 器 代码 是 C00003。C0 是 装 入 累 
加 器 指令 的 指令 指示 符 ， 寻 址 aaa 字段 为 000 表示 立即 数 寻 址 。 使 用 立即 数 寻 址 方式 ， 操 作 
数 指示 符 就 是 操作 数 ， 因 此 这 条 指令 把 0003 装 人 累加 器 ， 存 储 指 令 


004E E3FFFE STWA -2,s 


再 把 a 的 地 址 压 和 人 运行 时 栈 。 
类 似 地 ， 压 入 b 的 地 址 的 代码 是 


0051 C00005 LDWA b,i ;move &b 


E KIHLA CI Æ C00005， 这 里 0005 Æ b 的 地 址 。 这 条 指令 用 立即 数 寻 址 把 0005 装 入 累加 
器 ， 然 后 后 面 的 存储 指令 把 它 压 人 运行 时 栈 。 
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在 过 程 order() 中 ， 编 译 器 把 HOL6 层 上 的 证 语句 
if (*x > *y) 


翻译 成 Asmb5 层 上 的 三 条 语句 


0020 C40004 order: LDWA x,sf pif (*x > *y) 

0023 A40002 CPWA y,sf 

0026 140035 BRLE endif 

装 和 信和 比较 指令 中 的 寻 址 方式 为 sf， 代表 的 是 栈 相对 间接 寻 址 (stack-relative deferred 
addressing)» 


记 住 ， 栈 相对 寻 址 方式 的 操作 数 和 操作 数 指示 符 之 间 的 关系 是 
Oprnd = Mem[SP+ OprndSpec] 
栈 相对 间接 寻 址 方式 的 操作 数 和 操作 数 指示 符 之 间 的 关系 是 
Oprnd = Mem[Mem[SP + OprndSpec]] 

换 句 话说 ，Mem[SP + OprndSpec] 是 操作 数 的 地 址 ， 而 不 是 操作 数 本 身 。 

在 前 面 的 LDWA 指令 中 ,x 是 操作 数 指示 符 ， 是 保存 在 运行 时 栈 的 形 参 。 它 是 a 的 地 址 ， 
a 由 调用 者 压 人 栈 。 在 过 程 order() 中 ，HOL6 层 上 的 两 个 表达 式 x 和 *x 在 Asmbs 层 上 对 
应 于 : 

o HOL6 层 的 指针 x 在 Asmb5 层 的 Mem[SP+x] 处 ， 用 栈 相 对 寻 址 方式 s 来 访问 。 

o HOL6 层 的 整数 *x 在 Asmb5 层 的 Mem[Mem[SP+x]] 处 ， 用 栈 相对 间接 寻 址 方式 sf 

来 访问 。 

过 程 order() 调用 swap(x,y)。 因 为 实 参 是 x 而 不 是 *x， 过 程 order() 只 传递 swap() 要 用 

的 地 址 。 语 句 


0029 C30004 LDWA x,s ;move x 


用 栈 相 对 寻 址 把 地 址 放 和 人 累加 器 。 下 一 条 指令 把 这 个 地 址 放 人 运行 时 栈 。 

在 过 程 order() 中 ， 编 译 器 必须 翻译 

temp = *r; 
它 必须 把 *r 的 值 装 入 累加 器 ， 然 后 再 存储 到 temp。 因 为 装 和 人 的 是 *r 而 不 是 r， 所 以 使 用 的 
是 栈 相对 间接 寻 址 而 不 是 栈 相对 寻 址 。 编 译 器 翻译 赋值 语句 生成 如 下 目标 代码 : 


000A C40006 LDWA r,sf temp = *r 
000D E30000 STWA temp,s 


过 程 swap() 的 下 一 条 赋值 语句 


对 两 个 变量 都 使 用 了 * 解 引 用 操作 符 。 因 此 ， 编 译 器 生成 的 LDWA 和 STWA 都 使 用 栈 相对 
间接 寻 址 。 


0010 C40004 LDWA s,sf ;*r = *s 
0013 E40006 STWA r,sf 


图 6-28 展示 了 HOL6 层 和 Asmbs 层 的 运行 时 栈 。a 的 地 址 是 0003，main() 在 调用 
order() 时 把 它 入 栈 ， 用 于 形 参 x。 过 程 order() 在 调用 过 程 swap0 时 把 相同 的 地 址 压 和 人 栈 中 。 
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temp SP e—> 


retAddr 


a e NO 





P 
a) HOL6 层 的 运行 时 栈 b) Asmbs 层 的 运行 时 栈 
图 6-28 图 6-27 在 HOL6 层 和 Asmbs 层 的 运行 时 栈 


总 之 ， 为 了 用 全 局 变量 翻译 传 引用 调用 参数 ， 编 译 器 以 如 下 方式 生成 代码 : 
。 生成 使 用 立即 数 寻 址 方式 的 装 和 指令， 获得 调用 者 的 实 参 。 

。 生成 使 用 栈 相对 寻 址 方式 的 装 入 指令 ， 获 得 被 调用 者 的 形 参 x。 

。 生成 使 用 栈 相 对 间接 寻 址 方式 的 装 和 指令， 获得 被 调用 者 的 解 引 用 形 参 x。 


6.3.6 ”用 局 部 变量 翻译 传 引用 调用 参数 
图 6-29 是 一 个 计算 给 定 长 和 宽 的 矩形 周 长 的 程序 。 主 程序 通过 用 户 输入 两 个 局 部 变量 |328 


l 


width 和 height 给 出 长 和 宽 ，perim 是 第 三 个 局 部 变量 。 主 程序 调用 一 个 名 为 rect() 的 过 程 (329 
(返回 值 为 空 的 函数 )， 通 过 传 值 调 用 传递 width 和 height， 通 过 传 引用 调用 传递 perim。 图 中 
给 出 了 当 用 户 键 和 人 width X 8, height 为 5 时 的 输入 和 输出 。 


高 级 语言 


#include <stdio.h> 


void rect(int *p, int w, int h) { 
tp = (w + h) * 2; 


} 


int main() { 
int perim, width, height; 
printf ("Enter width: "); 
scanf ("%$d", &width) ; 
printf ("Enter height: "); 
scanf("%d", &height) ; 
rect (&perim, width, height); 
if wa 
printf ("Perimeter = %d\n", perim); 
return 0; 


} 


汇编 语言 
0000 12000E BR main 


j*eeeeee void rect(int *p, int w, int h) 
ps . EQUATE 6 ;formal parameter #2h 
w: . EQUATE 4 ;formal parameter #2d 


图 6-29 局 部 变量 作为 传 引用 调用 参数 
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. EQUATE 2 ;formal parameter #2d 
c30004 LDWA w,s ; (w +h) * 2 
630002 h,s 
OA 
E40006 psf 
01 
p*žžž*ž*x*x* Main () 
perim: .EQUATE 4 ;local variable #2d 
width: .EQUATE 2 ;local variable #2d 
height: .EQUATE 0 ;local variable #2d 
000E 580006 main: SUBSP 6,1 ;push #perim #width #height 
0011 490049 STRO msg1,d j;printf ("Enter width: ") 
0014 330002 DECI width,s ;scanf("%d", &width) 
0017 490057 STRO msg2,d ;printf ("Enter height: ") 
001A 330000 DECI height,s ;scanf("%d", &height) 
001D 03 MOVSPA ;move &perim 
001E 600004 ADDA perim,i 
0021 E3FFFE STWA -2,8 
0024 C30002 LDWA width,s ;move width 
0027 E3FFFC STWA -4,8 
002A C30000 LDWA height,s ;move height 
002D E3FFFA STWA -6,8 
0030 580006 SUBSP 6,i ;push #p #w #h 
0033 240003 rect ;rect (&perim, width, height) 
0036 500006 $ 6,i ;pop #h #w #p 
0039 490066 msg3,d ;print£ ("Perimeter = d\n", perim) ; 
003C 3B0004 perim,s 
003F DOOOOA "n'i 
0042 F1FC16 STBA charOut,d 
0045 500006 ADDSP 6,1 ;pop #height #width #perim 
0048 00 STOP 
0049 456E74 msgl: -ASCII "Enter width: \x00" 


0057 456E74 msg2: -ASCII "Enter height: \x00" 


0066 506572 msg3: -ASCII "Perimeter = \x00" 


0073 - END 


输入 /输出 

Enter width: 8 
Enter height: 5 
Perimeter = 26 





图 6-29 ( 续 ) 


图 6-30 是 程序 在 HOL6 层 的 运行 时 栈 。 将 此 图 和 传 引用 调用 全 局 变量 的 图 6-28a 进行 
比较 ， 在 那个 程序 里 ， 形 参 x、y、r 和 s 引用 全 局 变量 a 和 b, 在 Asmb5 层 ,a 和 b 在 翻译 
时 用 .EQUATE 点 命令 来 分 配 ， 它 们 的 符号 就 是 它们 的 地 址 。 然 而 ， 图 6-30 显示 perim 是 在 
运行 时 栈 上 分 配 的 。 语 句 
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000E 580006 main: SUBSP 6,i 
给 perim 分 配 存储 空间 ， 用 
perim: .EQUATE 4 ;local variable #2d 
定义 它 的 符号 ， 该 符号 不 是 它 的 绝对 地 址 。 符 号 是 相对 于 运行 时 栈 顶 部 的 地 址 ， 如 图 6-31a 


所 示 。 符 号 的 绝对 地 址 是 FB8D ， 为 什么 呢 ? 因为 这 是 应 用 程序 运行 时 栈 的 底部 ， 如 图 4-41 
中 的 内 存 映 射 所 示 。 


height 
width 





perim 
# 


a) 过 程 调用 前 b) 过 程 调用 后 
图 6-30 图 6-29 在 HOL6 6-31 图 6-29 在 Asmbs 层 的 运行 时 栈 
层 的 运行 时 栈 


因此 ， 编 译 器 不 能 像 对 全 局 变量 一 样 生 成 下 面 的 代码 把 参数 perim 压 人 栈 中 : 


LDWA perim,i 


STWA -2,s 
如 果 它 生成 那样 的 指令 ， 过程 rect() 就 会 修改 Mem[0004] 的 内 容 ， 而 0004 并 不 是 30 
perim 的 位 置 。 331 


perim 的 绝对 地 址 是 FB8D。 在 图 6-31a 中 可 以 看 到 ， 通 过 将 栈 指针 值 加 上 perim 的 值 
4， 就 会 得 到 这 个 绝对 地 址 。 幸 运 的 是 ， 一 元 指令 MOVSPA 可 以 把 栈 指针 的 内 容 移 到 累加 
器 ，MOVSPA 的 RTL 描述 是 
A+ SP 
为 了 压 入 perim AY HHE, Mret 6-29 中 的 001D 生成 如 下 的 指令 : 


001D 03 MOVSPA ;move &perim 
001E 600004 ADDA perim, i 
0021 E3FFFE STWA -2,s 


第 一 条 指令 把 栈 指针 的 内 容 移 到 累加 器 。 那 么 累加 器 里 就 是 FB89。 第 二 条 指令 把 
perim 的 值 4 加 到 累加 器 ， 得 到 FB8D。 第 三 条 指令 把 perim 的 地 址 放 到 p 的 单元 中 ， 过 程 
rect) 把 周 长 存 放 在 这 里 ， 图 6-31b 显示 执行 的 结果 。 

编译 器 翻译 过 程 rect() 中 的 *p， 就 像 所 有 的 过 程 使 用 任何 传 引 用 调用 的 参数 那样 。 也 就 
是 像 在 000A 处 ， 过 程 用 栈 相 对 间接 寻 址 来 存储 值 : 


000A E40006 STWA p,sf 


使 用 栈 相对 间接 寻 址 方式 ， 操 作 数 的 地 址 在 栈 上 。 操 作 数 是 
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Oprnd = Mem[Mem[SP + OprndSpec]] 
这 个 指令 把 操作 数 指示 符 6 加 到 栈 指针 FEB81 上 ， 得 到 FB87。 因 为 Mem[FB87] 是 
FB8D， 所 以 把 累加 器 的 值 存储 在 Mem[FB8D]。 
总 之 ， 为 了 用 局 部 变量 翻译 传 引用 调用 参数 ， 编 译 器 以 如 下 方式 生成 代码 : 
o 为 了 获得 调用 者 的 实 参 ， 生 成 一 元 MOVSPA 指令 ， 然 后 是 使 用 立即 数 寻 址 的 ADDA 
指令 。 
o 为 了 获得 被 调用 者 的 形 参 x， 生 成 使 用 栈 相对 寻 址 方式 的 装 和 人 指令 。 
e 为 了 获得 被 调用 者 的 解 引 用 形 参 *x， 生 成 使 用 栈 相对 间接 寻 址 方式 的 装 人 指令 。 


6.3.7 ”翻译 布尔 类 型 


在 汇编 层 存储 布尔 类 型 有 多 种 方法 。 最 适合 C 的 方法 是 把 值 的 true/false ( 真 / 假 ) 当 作 
整数 常量 。 这 两 个 值 是 


const int true = 1; 


const int false = 0; 


6-32 的 程序 声明 了 一 个 布尔 函数 inRange()。 库 stdbool.h 像 上 面 true 和 false 声明 的 
那样 定义 bool 类 型 。 


高 级 语言 
#include <stdio.h> 
#include <stdbool.h> 


const int LOWER = 21; 
const int UPPER = 65; 


bool inRange(int a) { 
if ((LOWER <= a) && (a <= UPPER)) { 
return true; 


} 


else { 


return false; 


} 


} 


int main() { 
int age; 
scanf("%d", &age); 
if (inRange(age)) { 
printf ("Qualified\n") ; 
} 
else { 
printf ("Unqualified\n") ; 
} 


return 0; 





图 6-32 布尔 类 型 的 翻译 


汇编 语言 
0000 120023 


C00015 
A30002 
1E001C 
C30002 
A00041 
1E001C 
C00001 
E30004 
01 

C00000 
E30004 
01 


580002 
330000 
C30000 
E3FFFC 
580004 
240003 
500004 
C3FFFE 
180044 
49004B 
120047 
490056 
500002 
00 

517561 


556E71 


true: 

false: 
LOWER: 
UPPER: 


‘ 


j**x**ee*e bool inRange(int a) 


retVal: 
a: 


inRange: LDWA 


if: 


BR main 
. EQUATE 1 
. EQUATE 0 


. EQUATE 21 
.EQUATE 65 


.EQUATE 4 
.EQUATE 2 
LOWER, i 
CPWA 


BRGT 
LDWA 
CPWA 
BRGT 
LDWA 
STWA 
RET 

LDWA 
STWA 
RET 


then: 


else: 


;*žk**x*xk* main() 
. EQUATE 
SUBSP 
DECI 
LDWA 
STWA 
SUBSP 
CALL 
ADDSP 
LDWA 
BREQ 
STRO 
BR 
STRO 
ADDSP 
STOP 
.ASCII 


age: 
main: 


then2: 


else2: 
endif2: 


msg1: 
.ASCII 


msg2: 


.END 


a,s 
else 
a,s 
UPPER, i 
else 
true,i 


retVal,s 


false,i 
retVal,s 


0 

Bi: 
age,s 
age,s 
-4,8 
4,1 
inRange 
4,1 
=2,8 
else2 
msgl,d 
endif2 
msg2,d 
2,1 
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;const int 
;const int 


;returned value #2d 
;formal parameter #2d 
;if ( (LOWER <= a) 


;&& (a <= UPPER) ) 


jreturn true 


;return false 


;local variable #2d 


;push #age 


;scanf ("%d", 


;move age 


&age) 


;push #retVal #a 
; inRange (age) 
jpop #a #retVal 
;if (inRange (age) ) 
;print£ ("Qualified\n") 


;printf ("Unqualified\n") ; 
;pop #age 


"Qualified\n\x00" 


"Unqualified\n\x00" 





图 6-32 ( 续 ) 


在 位 层 上 把 false ( 假 ) 和 true ( 真 ) 表示 为 0000 和 0001 (hex) 有 优势 也 有 人 劣势。 考虑 
对 布尔 量 进行 逻辑 运算 和 相应 的 汇编 指令 ANDr、ORr 和 NOTr。 如 果 p 和 gq 是 全 局 布尔 变 
E, 那么 
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p && q 
翻译 为 

LDWA p,d 

ANDA q,d 


如 果 用 这 个 目标 代码 AND 0000 和 0001， 得 到 预期 的 0000，OR 运算 | 也 能 得 到 预期 
的 结果 。 然 而 ，NOT 运算 会 有 问题 ， 因 为 如 果 对 0000 进行 NOT， 得 到 FFFF 而 不 是 0001， 
同样 对 0001 进行 NOT， 得 到 的 是 FFFE 而 不 是 0000。 因 此 ， 在 翻译 C 赋值 语句 


p= !G 


时 ， 编 译 器 不 会 生成 NOT 指令 ， 而 是 用 异 或 运算 XOR， 数 学 符号 为 四 。 它 有 一 个 非常 有 用 
的 属性 ， 如 果 对 任意 位 值 bp 和 0 进行 XOR， 会 得 到 b， 如 果 对 任意 位 值 b 和 1 进行 XOR， 
得 到 b 的 逻辑 负 值 。 数 学 表达 式 为 

b@0=b 

b®1=Ab 

不 幸 的 是 ，Pep/9 计算 机 指令 集中 没有 XORr 指令 。 如 果 它 有 这 样 的 指令 ， 编 译 器 将 给 
上 面 的 赋值 生成 如 下 的 代码 : 

LDWA q,d 


XORA 0x0001,i 
STWA p,d 


如 果 gq 为 false， 表示 0000 (hex), 0000 XOR 0001 等 于 0001， 与 预期 一 样 。 同 样 ， 如 
果 q 为 true， 表 示 0001 (hex), 0001 XOR 0001 等 于 0000. 

直到 1999 年 ，C 语言 标准 库 中 都 没有 bool 类 型 。 老 编译 器 使 用 的 规则 是 布尔 运算 符 对 
整数 进行 运算 ， 把 整数 值 0 解释 为 false， 其 他 非 零 整数 解释 为 true。 为 了 保证 向 后 兼容 ， 现 
在 的 C 编译 器 维持 了 这 一 规则 。 


6.4 变 址 寻 址 和 数组 


HOL6 层 的 变量 在 ISA3 层 是 一 个 内 存单 元 。HOL6 层 的 变量 通过 变量 名 来 引用 ， 在 
ISA3 层 是 通过 地 址 。 在 AsmbS Je, 通过 符号 名 来 引用 变量 ， 而 符号 的 值 是 内 存单 元 的 
地 址 。 

数组 的 值 又 是 怎样 呢 ? 数组 包含 许多 元 素 ， 由 许多 内 存单 元 组 成 ， 这 些 内 存单 元 是 连续 
的 、 相 互 邻 接 的 。 在 HOL6 层 ， 数 组 有 数组 名 。 在 Asmb5 层 ， 对 应 符号 的 地 址 是 数组 第 一 
个 内 存单 元 的 地 址 。 本 节 说 明 编 译 器 怎样 翻译 分 配 和 访问 一 维 数组 元 素 的 源 程序 ， 翻 译 使 用 
了 多 种 变 址 寻 址 的 形式 。 

图 6-33 总 结 了 Pep/9 的 所 有 寻 址 方式 。 我 们 在 前 面 的 程序 中 说 明了 立即 数 、 直 接 、 栈 
相对 和 栈 相 对 间接 寻 址 。 带 有 数组 的 程序 使 用 变 址 、 栈 变 址 和 栈 间接 变 址 寻 址 。 标 有 aaa 的 
那 一 列 展示 了 在 ISA3 层 的 寻 址 aaa 字段 ， 标 有 字母 的 那 一 列 展示 了 在 Asmbs 层 寻 址 方式 的 
汇编 语言 名 称 ， 标 有 操作 符 那 一 列 展示 了 CPU 根据 操作 数 指示 符 (OprndSpec) 怎样 确定 操 
作 数 。 
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立即 数 000 OpmdSpec 

se -o ow a MemfOpmdSpec} 

间接 010 n Mem[Mem[OprndSpec]] 
ee ee a Mem[SP+ OpmdSpec] 

栈 相对 间接 100 sf Mem[Mem[SP+OprndSpec]] 
变 址 qe iD ls Mem[OpmdSpec+X] 

栈 变 址 110 SX Mem[SP +OprndSpec +X] 
RME 1 s Mem[Mem[SP+OprdSpec]+X] 


图 6-33 Pep/9 的 寻 址 方式 


6.4.1 翻译 全 局 数组 


除了 变量 不 是 局 部 变量 而 是 全 局 变量 之 外 ， 图 6-34 的 C 程序 和 图 2-15 的 程序 是 一 样 
的 。 它 给 出 了 一 个 HOL6 层 程序 ， 声 明了 有 4 个 整数 的 全 局 数组 vector 和 一 个 全 局 整数 j。 
主 程序 用 一 个 for 循环 输入 4 个 整数 到 数组 ， 以 逆序 输出 这 4 个 整数 和 它们 的 索引 。 


高 级 语言 


#include <stdio.h> 


int vector[4]; 
int jy 


int main() { 


for (j = 0; j < 4; j++) { 


scanf("%d", &vector[j]); 
} 
for (j = 3; j >= 0; j--) { 
printf("sd %d\n", j, vector[j]); 
} 
return 0; 


} 


汇编 语言 
0000 12000D BR 
0003 000000 vector: .BLOCK ;global variable #2d4a 
000000 
0000 
0000 jt «BLOCK ;global variable #2d 
peeeeeee main () 
C80000 main: LDWX i pEor {j 
E9000B STWX 
A80004 fori: CPWX i ij <4 


图 6-34 全 局 数组 
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100029 endForl 

0B two bytes per integer 
350003 vector,x ;scanf("%d", &vector[j] ) 
C9000B j,d ;j++) 

680001 1, 

E9000B j,da 

120013 forl 

C80003 endForl: 3,i 

E9000B Jed 

A80000 for2: 0,i 

160054 endFor2 

39000B j,da ¡printf ("td td\n", j, vector[j]) 
D00020 W F 

F1FC16 charOut,d 

OB ¿two bytes per integer 
3D0003 vector,x 

DOOOOA ‘Yn td 

F1FC16 charOut,d 

C9000B j,a 

780001 pe 

E9000B {xa 

12002F for2 

00 





338 图 6-34 ( 续 ) 


图 6-35 展示 了 整数 j 和 数组 vector 的 内 存 分 配 。 和 所 有 的 全 局 整数 一 样 ， 编 译 器 把 
HOL6 层 的 

int jy 
翻译 为 Asmb5 层 的 语句 : 

000B 0000 j: .BLOCK 2 ;global variable #2d 

编译 器 把 HOL6 层 的 

int Vector [4] ; 
翻译 为 Asmb5 层 的 语句 : 


0003 000000 vector: .BLOCK 8 ;global variable #2d4a 
000000 
0000 


由 于 数组 有 4 个 整数 ， 所 以 分 配 8 字 节 ， 每 个 整数 2 字 节 。 从 图 6-35 可 以 看 到 0003 是 
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数组 第 一 个 元 素 的 地 址 ， 第 二 个 元 素 的 地 址 是 0005， 每 个 元 素 的 地 址 比 前 一 个 元 素 的 地 址 
大 2 字 节 。 
格式 跟踪 标签 说 明 数 组 有 多 少 个 单元 以 及 多 少 字 


0003 vector [0] 
节 。 应 该 把 格式 跟踪 标签 #2d4a 读 作 “ 两 字 节 十 进 制 ， a 
4 单元 数组 ” o 使 用 这 种 说 明 9 Pep/9 调试 器 将 生成 类 0007 vector [2] 
似 于 图 6-35 那样 的 每 个 单元 都 有 标记 的 数组 示意 图 。 0009 vector [3] 
编译 器 照常 翻译 第 一 个 for 语句 000B j 
for (j = 0; j < 4; j++) 图 6-35 图 6-34 全 局 数组 的 内 存 分 配 


由 于 j 是 全 局 变量 ， 所 以 用 直接 寻 址 访问 j。 但 是 怎样 
访问 vector[j] W? 不 能 只 是 使 用 直接 寻 址 ， 因 为 符号 vector 的 值 是 数组 第 一 个 元 素 的 地 址 。 
如 果 j 的 值 是 2， 它 应 该 访问 数组 的 第 三 个 元 素 ， 而 不 是 第 一 个 。 

答案 是 使 用 变 址 寻 址 。 使 用 变 址 寻 址 时 ，CPU 计算 操作 数 为 

Oprnd = Mem[OprndSpec + X] 

它 将 操作 数 指示 符 和 变 址 寄存 器 相 加 ， 把 和 作为 主 存 地 址 ， 然 后 从 这 个 地 址 获取 操 
作 数 。 

在 图 6-34 中 ， 编 译 器 将 HOL6 层 的 


scanf ("%d", &vector[j]); 


翻译 为 Asmb5 层 的 


0019 OB ASLX ;two bytes per integer 
001A 350003 DECI vector,x ;scanf("%d", &vector[j]) 


这 是 优化 过 的 翻译 结果 。 编 译 器 分 析 前 面 生成 的 代码 ， 确 定 变 址 寄存 器 包含 的 是 现在 j 的 
fei. 非 优化 编译 器 会 生成 下 面 的 代码 


LDWX j,d 
ASLX 
DECI vector,x 


假定 j 的 值 为 2，LDX 将 j 的 值 放 入 变 址 寄存 器 (或 者 ， 优 化 编译 器 确定 现在 的 j 值 已 
经 在 变 址 寄存 器 里 )。ASLX 将 2 乘 以 2， 把 4 放 人 变 址 寄存 器 。DECI 使 用 变 址 寻 址 。 因 此 ， 
这 样 计 算 操 作 数 

Mem[OprndSpec + x] 

Mem[0003 + 4] 

Mem[0007] 

它 是 图 6-35 中 的 vector[2]。 如 果 数 组 是 字符 数组 ,那么 ASLX 运算 就 不 必要 了 ， 因 为 
每 个 字符 仅 占 1 字 节 。 一 般 来 说 ， 如 果 数 组 的 每 个 单元 占用 亏 字 节 ， 那 么 j 的 值 乘 以 装 入 
变 址 寄存 器 ， 用 变 址 寻 址 访问 数组 元 素 。 

类 伏地 ， 编 译 器 用 变 址 寻 址 方式 将 vector[j] 的 输出 翻译 为 


003E OB ASLX ;two bytes per integer 
003F 3D0003 DECO vector,x 


总 之 ,为 了 翻译 全 局 数组 ， 编 译 器 遵循 如 下 规则 生成 代码 : 
e 用 .BLOCK tot 给 数组 分 配 存储 空间 ，tot 是 数组 占用 的 总 字 节 数 。 
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o 用 LDWX 把 变 址 放 入 变 址 寄存 器 来 访问 数组 元 素 ， 生 成 代码 把 索引 乘 以 每 个 单元 的 
340 字 节 数 (ASLX 对 应 于 每 个 元 素 占 两 个 字 节 的 整数 数组 )， 使 用 变 址 寻 址 。 


6.4.2 翻译 局 部 数组 


就 像 所 有 的 局 部 变量 一 样 ， 局 部 数组 在 程序 执行 期 间 在 运行 时 栈 上 进行 分 配 。SUBSP 
指令 给 数组 分 配 空 间 ，ADDSP 指令 释放 空间 。 除 了 索引 j 和 数组 vector 是 main) 的 局 部 变 
量 外 ， 图 6-36 的 程序 和 图 6-34 的 程序 是 一 样 的 。 


高 级 语言 


#include <stdio.h> 


int main() { 

int vector [4]; 

int j; 

for (j = 0; j < 4; j++) { 
scanf ("%d", &vector[j]); 

} 

for’ tj ; j 5= 0; j--) { 
printf("td d\n", j; vector[j]); 

} 


return 0; 


0000 120003 BR 


ww 火炎 大 大 Main () 
vector: .EQUATE ;local variable #2d4a 
43 . EQUATE ;local variable #2d 
58000A main: SUBSP 10,i ¡push #vector #j 
C80000 LDWX 0,i Eor {j = 0 
EB0000 STWX 4,8 
A80004 CPWX aod sy 2 4 
100022 BRGE endForl 
OB ASLX ¡two bytes per integer 
360002 DECI vector, sx ;scanf("%td", &vector[j]) 
CBO0000 LDWX j,s ;j++) 
341 680001 ADDX d,i 
EB0000 STWX j,s 
12000C BR forl 
C80003 endForl: LDWX 3,4 
EBO000 STWX j,s 
A80000 for2: CPWX 0,i 
16004D BRLT endFor2 
3B0000 DECO Jre ¿printf ("%d %d\n", j, vector [j]) 
D00020 LDBA 1 dt 
F1FC16 STBA charOut,d 
OB ASLX itwo bytes per integer 
3E0002 DECO vector, sx 





图 6-36 局 部 数组 。 用 局 部 变量 的 图 6-34 的 C 程序 
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DOOOOA "\n',i 
F1FC16 charOut,d 
CB0000 

780001 


EB0000 

120028 

50000A endFor2: +3 ;POP #j #vector 
00 





图 6-36 (42) 
图 6-37 展示 了 图 6-36 中 的 程序 在 运行 时 栈 上 的 内 存 分 配 。 编 译 器 把 HOL6 层 的 


int Vector [4] ; 
int 3; 


翻译 成 Asmbs 层 的 
0003 58000A main: SUBSP 10,i ;push #vector #j 


给 vector 分 配 8 FH, Bj 分 配 2 字 节 ， 总 共 10 FAW. M 


vector: .EQUATE 2 ;local variable #2d4a 
jz .EQUATE 0 ;local variable #2d 


SP —> j 
设置 符号 的 值 ， 这 里 2 vector 第 一 个 单元 的 栈 相 : nice mus 
对 地 址 ，0 是 j 的 栈 相 对 地 址 ， 如 图 6-37 所 示 。 4 FB89 vector [1] 
编译 器 是 怎样 访问 vector[j] 的 呢 ? 不 能 使 用 变 6 FB8B vector [2] 
址 寻 址 ， 因 为 符号 vector 的 值 不 是 数组 第 一 个 元 素 8 FB8D vector [3] 
的 地 址 。 需 要 使 用 栈 变 址 寻 址 。 使 用 栈 变 址 寻 址 ， á 
CPU 这 样 计算 操作 数 6-37 图 6-36 局 部 数组 的 内 存 分 配 


Oprnd = Mem[SP + OprndSpec + X] 
将 栈 指针 、 操 作 数 指示 符 和 变 址 寄存 器 相 加 ， 把 这 个 和 作为 它 从 主 存 获取 操作 数 的 地 址 。 
在 图 6-36 中 ， 编 译 器 把 HOL6 层 的 


scanf ("%d", &vector[j]); 


翻译 成 Asmbs 层 的 


0012 OB ASLX ;two bytes per integer 
0013 360002 DECI vector,sx ;scanf("%d", &vector[j]) 


和 前 面 的 程序 一 样 ， 这 是 一 个 优化 的 翻译 。 非 优化 编译 器 将 会 生成 下 面 的 代码 : 


LDWX j,d 
ASLX 
DECI vector,sx 


假定 j 的 值 为 2，LDWX 把 j 的 值 放 入 变 址 寄存 器 。ASLX 把 2 乘 以 2， 变 址 寄存 器 中 
的 内 容 变 为 4。DECI 使 用 栈 变 址 寻 址 。 这 样 ， 像 下 面 这 样 计算 操作 数 

Mem[SP + OprndSpec + X] 

Mem[FB85 + 2 + 4] 

Mem[FB8B] 


226 BOYD CRE (BIB) 


它 是 图 6-37 中 的 vector[2]。 我 们 可 以 看 到 栈 变 址 寻 址 是 如 何 设计 来 为 运行 时 栈 上 的 
数组 服务 的 。SP 是 栈 顶 地 址 ，OprndSpec 是 数组 第 一 个 单元 的 栈 相 对 地 址 ， 因 此 SP + 
OprndSpec 就 是 数组 第 一 个 单元 的 绝对 地 址 。 变 址 寄存 器 里 存放 的 是 j ( 乘 以 数组 每 个 单元 
的 字 节 数 )， 因 此 SP + OprndSpec + X 的 和 是 数组 单元 j 的 地 址 。 

总 之 ， 为 了 翻译 局 部 数组 ， 编 译 器 遵循 如 下 规则 生成 代码 : 

e 用 立即 数 寻 址 的 SUBSP tot 对 数组 进行 分 配 ，tot 是 数组 占用 的 总 字 节 数 。 

e 用 LDWX 把 变 址 放 入 变 址 寄存 器 来 获得 数组 元 素 ， 生 成 代码 把 索引 乘 以 每 个 单元 的 

字 节 数 (ASLX 对 应 于 每 个 元 素 占 两 个 字 节 的 整数 数组 )， 使 用 栈 变 址 寻 址 。 


6.4.3 ”翻译 作为 参数 传递 的 数组 


在 C 中 ,数组 名 不 使 用 方 括号 []， 它 是 数组 第 一 个 元 素 的 地 址 。 当 要 传递 一 个 数组 时 ， 
即使 在 实 参 列表 中 不 用 && 指 明 ， 也 是 传递 的 数组 第 一 个 元 素 的 地 址 。 这 个 效果 就 与 传 引用 
调用 数组 一 样 。C 语言 的 设计 者 认为 程序 员 几 乎 从 来 不 会 想 去 传 值 调用 一 个 数组 ， 因 为 这 样 
的 调用 效率 太 低 。 由 于 栈 必 须 包含 整个 数组 ， 所 以 要 求 运行 时 栈 必 须 有 大 量 的 存储 空间 。 还 
会 需要 大 量 的 时 间 ， 因 为 每 个 单元 的 值 要 复制 到 栈 中 。 因 此 ，C 中 对 数组 默认 的 是 传 引用 
调用 。 

图 6-38 展示 了 编译 器 怎样 翻译 一 个 把 局 部 数组 作为 参数 传递 的 程序 。 主 程序 传递 整数 
数组 vector 和 整数 numitms 到 过 程 getVect() 和 putVect(), getVect() 把 值 输入 到 数组 并 把 
numitms 设置 为 输入 条 目的 数量 值 ，putVect0 输出 数组 的 值 。 


高 级 语言 


#include <stdio.h> 


void getVect(int v[], int *n) { 
int 37 
scanf ("%d", n); 
for (j = 0p j < *n; j++) { 
scanf("%d", &v[j]); 
} 
} 


void putVect (int v[], int n) { 
int je 


for (j = 0; j < n; j++) { 
printf ("td ", vijl); 
} 
printé ("\n*) ; 
} 


int main() { 


int vector [8]; 

int numItms; 

getVect (vector, &numItms) ; 
putVect (vector, numItms) ; 
return 0; 





6-38 将 局 部 数组 作为 参数 传递 
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汇编 语言 
0000 120058 BR 
;eekeeeee GetVect (int v[], int *n) 
-EQUATE 6 ;formal parameter #2h 
.EQUATE 4 ;formal parameter #2h 
j: .EQUATE 0 ;local variable #2d 
580002 getVect: SUBSP 2,i ;push #3 
340004 DECI n,sf scanf ("%d", n) 
C80000 LDWX 0,i ;for (j= 0 
EB0000 STWX j,s 
AC0004 n,sf 7] < *n 
100025 endForl 
0B itwo bytes per integer 
370006 v,stx ;Scanf ("%d", &v[j]) 
CB0000 4,8 ;j++) 
680001 sE 
EB0000 Jya 
12000F fori 
500002 endForl1: 2,i ;pop 村 
01 
p**eeee* putVect (int v[], int n) 
v2: -EQUATE 6 ;formal parameter #2h 
n2: .EQUATE 4 ;formal parameter #2d 
J2: .EQUATE 0 ;local variable #2d 
580002 putVect: SUBSP 2,i ;push #j2 
C80000 LDWX 0,i ;for (j = 0 
EB0000 STWX j2,s 
ABOO04 CPWX n2,s ;j <n 
1C004E BRGE endFor2 
0B ASLX ;two bytes per integer 
3F0006 DECO v2, Sfx ;printft ("sd ", vI[j]) 
D00020 4 
F1FC16 charOut,d 
CB0000 j2,s ;j++) 
680001 1,i 
EB0000 j2,s 
120032 for2 
D0000A endFor2: Niti ¡printf ("\n") 
F1FC16 charOut ,d 
500002 Zyé ;pop #j2 
01 
přkkkž** main () 
vector: .EQUATE jlocal variable #2d8a 
numitms: .EQUATE ;local variable #2d 
580012 main: SUBSP i ;push storage for #vector #numitms 
03 MOVSPA ;move (&) vector 
600002 ADDA vector,i 





图 6-38 (2%) 
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E3FFFE 
03 

600000 
E3FFFC 
580004 
240003 
500004 
03 

600002 
E3FFFE 
C30000 
E3FFFC 
580004 
240029 
500004 
500012 
00 


输入 
50 60 70 80 


输出 


40 50 60 70 80 


STWA 
MOVSPA 
ADDA 
STWA 
SUBSP 
CALL 
ADDSP 
MOVSPA 
ADDA 
STWA 
LDWA 
STWA 
SUBSP 


如 图 6-38 所 示 ， 编 译 器 将 局 部 变量 


int Vector [8] ; 


int numitms; 


翻译 成 


0057 


Vector: 
numItms: 
580012 main: 


-EQUATE 2 
. EQUATE 0 


SUBSP 


=2,8 


numItms, i 
-4,8 

4,i 
getVect 
4,i 


vector,i 
-2,8 
numItms, s 
-4,8 

4,i 
putVect 
4,1 

18,i 


图 6-38 (2) 


;move &numItms 


;push #v #n 

;getVect (vector, &numItms) 
;pop #n #v 

;move (&) vector 


;move numitms 


;push #v2 #n2 

;putVect (vector, numItms) 
jpop #n2 #v2 

;pop #numItms #vector 





;local variable #2d8a 
;local variable #2d 


18,i ;push #vector #numItms 


SUBSP 指令 在 运行 时 栈 上 压 人 18 字 节 ,16 字 节 用 于 数组 的 8 个 整数 ，2 字 节 用 于 整数 。 


点 命令 EQUATE 把 符号 设置 成 它们 对 应 的 栈 偏 移 量 ， 如 图 6-39a 所 示 。 
编译 器 要 翻译 


getVect (vector, 


&numitms) ; 


首先 生成 把 vector 的 第 一 个 单元 的 地 址 压 入 栈 中 的 代码 


005B 03 MOVSPA 

005C 600002 ADDA vector,i 

OOSF E3FFFE STWA -2,8 
接着 生成 压 入 numItms 地 址 的 代码 

0062 03 MOVSPA 

0063 600000 ADDA numItms, i 


0066 


E3FFFC STWA 


-4,8 


jmove (&) vector 


;move &numItms 
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retAddr 
—4 FB79 n n 
—2 FB7B v v 
SPe—> 0 FB7D numItms numItms 
2 FB7F vector [0] vector [0] 
4 FB81 vector [1] vector [1] 
6 FB83 vector [2] vector [2] 
8 FB85 vector [3] vector [3] 
10 FB87 vector [4] vector [4] 
12 FB89 vector [5] vector [5] 
14 FB8B vector [6] vector [6] 
16 FB8D vector [7] vector [7] 
六 
a) 调用 getVect() 前 b) 调用 getVect() 后 


图 6-39 图 6-38 所 示 程 序 的 运行 时 栈 


尽管 C 程 序 中 第 一 个 实 参 是 vector 而 不 是 &vector， 但 是 编译 器 会 生成 代码 ， 用 
MOVSPA 和 ADDA 指令 压 入 v 的 地 址 。 和 往常 一 样 ， 第 二 个 实 参 &numItms 有 前 级 的 地 址 
运算 符 肥 ， 因 此 ， 编 译 器 用 同样 的 方法 将 它 的 地 址 人 栈 。 请 记 住 , C 的 数组 是 一 个 特殊 情况 ， 
默认 用 传 引用 调用 ， 而 不 在 实 参 表 中 使 用 & 地 址 运算 符 。 图 6-39b 说 明 v 等 于 FB7F B 
vector[0] 的 地 址 ; n 是 FB79， 即 numitms 的 地 址 。 

图 6-39b 也 展示 了 getVect() 中 参数 和 局 部 变量 的 栈 偏 移 量 。 编 译 器 相应 地 定义 符号 : 


v: .EQUATE 6 ;formal parameter #2h 
n: .EQUATE 4 ;formal parameter #2h 
j: .EQUATE 0 ;local variable #2d 


把 输入 语句 翻译 为 
0006 340004 DECI n,sf ;scanf("%d", n) 


这 里 使 用 栈 相对 间接 寻 址 ， 因 为 n 是 传 引 用 调用 的 ,n 的 地 址 在 栈 上 。 
但 是 编译 器 怎样 翻译 


scanf ("%d", &v[j]); 


WE? 不 能 使 用 栈 变 址 寻 址 方式 ， 因 为 该 数组 的 值 不 在 getVect() 的 栈 帧 中 。v 的 值 为 6， 这 表 
示 数 组 第 一 个 单元 的 地 址 在 栈 顶 下 面 6 字 节 的 位 置 。 该 数组 的 值 在 main) 的 栈 帧 中 。 栈 间 
接 变 址 寻 址 就 是 设计 用 来 访问 这 样 的 数组 元 素 ， 数 组 的 地 址 在 顶部 的 栈 帧 中 ， 但 是 实际 的 值 
并 不 在 。CPU 用 栈 间 接 变 址 寻 址 来 这 样 计 算 操作 数 : 
Oprnd = Mem[Mem[SP + OprndSpec] + X] 
栈 指针 和 操作 数 指示 符 相 加 ， 把 这 个 和 作为 数组 第 一 个 元 素 的 地 址 ， 再 把 这 个 地 址 和 变 
址 寄存 器 相 加 。 编 译 器 把 输入 语句 翻译 成 


0015 0B ASLX ;two bytes per integer 
0016 370006 DECI v,sfx j;scanf("%d", &v[j]) 


这 里 sfx 表示 是 栈 间 接 变 址 寻 址 ， 编 译 器 已 经 确定 变 址 寄存 器 里 包含 j 的 当前 值 。 
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例如 ， 假 定 j 的 值 是 2，ASLX 指令 把 它 乘 以 2 得 到 4， 操作 数 的 计算 如 下 : 

Mem[Mem[SP + OprndSpec] + X] 

Mem[Mem[FB75 + 6] + 4] 

Mem[Mem[FB7B] + 4] 

Mem[FB7F + 4] 

Mem[FB83] 
‘Exe vector[2]， 和 图 6-39b 预期 的 一 样 。 

在 图 6-39 中 过 程 getVect() 和 putVect() 形 参 的 名 字 是 一 样 的。 在 HOL6 层 ， 参 数 名 的 范 
围 ， 限 制 在 函数 体内 。 程 序 员 知 道 在 getVect() 体 中 包含 n 的 语句 引用 的 是 getVect() 参数 列 
表 中 的 an， 而 不 是 putVect() 参数 列表 中 的 n。 然 而 ， 在 Asmb5 层 ， 符 号 名 的 范围 却 是 整个 
汇编 语言 程序 。 编 译 器 不 能 给 putVect() FAY n 使 用 与 getVect() F n 一 样 的 符号 ， 因 为 重复 
的 符号 定义 会 引起 歧义 。 所 有 的 编译 器 在 将 HOL6 层 的 名 字 声 明 翻 译 到 Asmbs 层 的 符号 时 ， 
必须 有 某 种 用 来 管理 这 些 名 字 声 明 范 围 的 机 制 。 图 6-38 中 的 编译 器 通过 给 符号 名 附加 数字 
2 形成 无 二 义 性 的 标识 符 。 因 此 编译 器 将 HOL6 层 的 putVect() 中 的 变量 名 n 翻译 成 Asmb5 
层 的 符号 n2， 对 v 和 j 做 同样 的 处 理 。 

在 过 程 putVect() 中 ， 数 组 作为 参数 传递 但 n 是 传 值 调 用 。 在 准备 过 程 调用 时 ， 和 
前 面 一 样 ， 将 vector 的 地 址 压 入 栈 ， 但 这 次 是 将 numitms 的 值 而 不 是 地 址 压 人 栈 。 在 过 程 
putVect() 中 ， 使 用 栈 相 对 寻 址 来 访问 n2: 


0032 AB0004 for2: CPWX n2,s ;j <n 


只 是 因为 n2 是 传 值 调用 。 使 用 栈 间 接 变 址 寻 址 来 访问 v2 
0038 OB ASLX ;two bytes per integer 
0039 3F0006 DECO v2,sfx ;printf("td ", v[j]) 
PURE CE getVect() 中 一 样 。 
在 图 6-38 中 ，vector 是 局 部 数组 。 如 果 它 是 全 局 数组 ， 那 么 对 getVect() 和 putVect() 的 
翻译 不 会 改变 。 使 用 栈 间 接 变 址 寻 址 来 访问 v[j] ， 它 预期 数组 的 第 一 个 元 素 的 地 址 在 顶部 的 
栈 帧 中 。 唯 一 的 不 同 的 是 在 准备 调用 时 压 人 数组 第 一 个 元 素 地 址 的 代码 ， 与 图 6-34 中 的 程 
序 一 样 ， 全 局 数组 的 符号 值 是 数组 第 一 个 单元 的 地 址 。 因 此 要 压 人 数组 第 一 个 单元 的 地 址 ， 
编译 器 会 生成 一 条 使 用 立即 数 寻 址 的 LDWA 指令 ， 后 面 跟 一 个 栈 相 对 寻 址 的 STWA 指令 来 
进行 压 人 。 
总 之 ， 为 了 把 数组 作为 参数 传递 ， 编 译 器 遵循 如 下 规则 生成 代码 : 
e 为 了 访问 调用 程序 的 实 参 ， 即 数组 的 第 一 个 元 素 的 地 址 ， 或 者 a) 对 于 局 部 数组 ， 用 
MOVSPA， 后 面 跟 采 用 立即 数 寻 址 的 ADDA; 或 者 b) 对 于 全 局 数组 ， 使 用 立即 数 寻 
址 的 LDWA。 

e 用 LDWX 把 变 址 放 入 变 址 寄存 器 来 访问 被 调用 程序 的 数组 元 素 ， 生 成 代码 把 索引 乘 
以 每 个 单元 的 字 节 数 (ASLX 对 应 于 每 个 元 素 占 两 个 字 节 的 整数 数组 )， 使 用 栈 间接 
变 址 寻 址 。 


6.4.4 翻译 switch 语句 
图 6-40 中 的 程序 就 是 图 2-12 中 的 程序 ， 它 展示 了 编译 器 怎样 翻译 C 的 switch 语句 。 这 
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个 程序 使 用 了 一 个 有 趣 的 变 址 寻 址 和 无 条 件 分 支 BR 的 结合 。switch a) ARE if EAE 
不 一 样 的 。 如 果 用 户 给 guess 输入 2，switch 语句 不 会 将 guess 与 0 和 1 比较 ， 而 是 直接 分 
支 到 第 三 个 选择 。 由 于 索引 机 制 允 许 程 序 员 不 用 遍历 所 有 前 面 的 元 素 而 随机 访问 任意 元 素 ， 
所 以 数组 是 一 个 随机 访问 的 数据 结构 。 例 如 ， 要 访问 一 个 整数 向 量 的 第 三 个 元 素 ， 可 以 直接 
写 vector[2] 而 不 用 先 遍 历 vector[0] 和 vector[1]。 主 存 实际 上 是 1 字 节 数组 ， 字 节 的 地 址 就 
对 应 于 这 个 数组 的 索引 。 为 了 翻译 switch 语句 ， 编 译 器 分 配 一 个 叫 作 转 移 表 (jump table) 的 
地 址 数组 。 转 移 表 中 的 每 个 表 项 是 一 段 代码 第 一 条 语句 的 地 址 ， 每 段 代码 对 应 switch 语句 
的 一 种 情况 。 使 用 变 址 寻 址 ， 程 序 能 够 直接 分 支 情况 2 (case 2 ) 。 


高 级 语言 


#include <stdio.h> 


int main() { 
int guess; 
printf ("Pick a number 0..3: "); 
scanf("%$d", &guess) ; 


switch (guess) { 


case 0: printf("Not close\n"); break; 
case 1: printf("Close\n"); break; 
case 2: printf("Right on\n"); break; 
case 3: printf("Too high\n") ; 

} 


return 0; 


} 


汇编 语言 
0000 120003 BR 
PR main() 
guess: .EQUATE 0 ;local variable #2d 

580002 main: SUBSP Aig ;push #guess 
490034 STRO msgin,d ;printf ("Pick a number 0..3: ") 
330000 DECI guess,s ;scanf("%d", &guess) 
CB0000 LDWX guess,s ;Switch (guess) 
0B ASLX ¿two bytes per address 
130013 BR guessJT,x 
001B guessJT: .ADDRSS case0 
0021 -ADDRSS casel 
0027 -ADDRSS case2 
002D -ADDRSS case3 
490049 case0: STRO msg0,d ;printf ("Not close\n") 
120030 BR endCase ; break 
490054 casel: STRO msgl,d ;printf ("Close\n") 
120030 BR endCase ; break 
49005B case2: STRO msg2,d ;printf ("Right on\n") 
120030 BR endCase ; break 
490065 case3: STRO msg3,d ;printf ("Too high\n") 
500002 endCase: ADDSP Ay ;pop #guess 
00 STOP 


图 6-40 switch 语句 的 翻译 。 这 个 C 程序 来 自 图 2-12 





232 FORD LBA (FSB) 


0034 506963 : f "Pick a number 0..3: \x00" 
0049 4E6F74 : ë "Not close\n\x00" 
0054 436C6F : : "Close\n\x00" 


005B 526967 : "Right on\n\x00" 


0065 546F6F 3 "Too high\n\x00" 


006F 


Symbol table 





图 6-40 ( 续 ) 


图 6-40 展示 了 汇编 语言 程序 中 在 0013 处 的 转移 表 。 在 0013 生成 的 代码 是 001B， 这 是 
情况 0 (case 0 ) 第 一 条 语句 的 地 址 ， 在 0015 生成 的 代码 是 0021， 这 是 情况 1 (case 1 ) 第 一 
条 语句 的 地 址 ， 以 此 类 推 。 编 译 器 用 .ADDRSS 伪 操 作 生 成 转移 表 ， 每 个 .ADDRSS 命令 后 
面 必须 跟 一 个 符号 ，.ADDRSS 生成 的 代码 是 符号 的 值 。 例 如 ，case2 是 一 个 符号 ， 它 的 值 是 
0027， 这 是 如 果 guess 的 值 为 2 时 要 执行 代码 的 地 址 。 因 此 ， 


-ADDRSS case2 


在 0017 处 生成 的 目标 代码 是 0027。 
假定 用 户 为 guess 的 值 输 入 2， 语句 
000C CB0000 LDWX guess,s ;switch (guess) 
把 2 放 入 变 址 寄存 器 ， 语 名 


000F OB ASLX ;two bytes per address 


将 2 乘 以 2， 变 址 寄存 器 中 为 4， 语句 


0010 130013 BR guessJT,x 


是 变 址 寻 址 的 无 条 件 分 支 。 操 作 数 指示 符 guessJT 的 值 是 0013 ， 这 是 转移 表 第 一 个 字 的 地 
址 。 对 于 变 址 寻 址 ，CPU 这 样 计算 操作 数 

Oprnd = Mem[OprndSpec + X] 

因此 CPU 计算 

Mem[OprndSpec + X] 

Mem[0013 + 4] 
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Mem[0017] 
0027 
将 0027 作为 操作 数 。BR 指令 的 RTL 描述 是 
PC + Oprnd 
因此 CPU 把 0027 放 在 程序 计数 器 。 因 为 执行 冯 . 诺 依 曼 周期 ， 所 以 下 一 条 要 执行 的 指 
令 是 在 地 址 0027 处 的 指令 ， 这 正好 是 情况 2 (case 2 ) 的 第 一 条 指令 。 353 
C 中 的 break 语句 被 翻译 成 一 条 BR 指令 ， 分 支 到 switch 语句 的 未 尾 。 如 果 在 C 程序 中 
省 略 了 break， 那 么 编译 器 也 会 省 略 这 个 BR， 控 制 将 转移 到 下 一 个 情况 (case) 中 。 
如 果 用 户 键入 一 个 不 在 0 一 3 范围 内 的 数 ， 那 么 就 会 发 生 运行 时 错误 。 例 如 ， 如 果 用 户 
给 guess 键入 4，ASLX 指令 将 它 乘 以 2， 那么 变 址 寄存 器 中 为 8，CPU 这 样 计算 操作 数 
Mem[OprndSpec + X] 
Mem[0013 + 8] 
Mem[001B] 
4100 
因此 将 分 支 到 内 存单 元 4100 (hex) 处 。 问 题 在 于 汇编 程序 给 STRO 指令 生成 001B， 这 
个 001B 不 是 作为 分 支 地 址 来 解释 的 。 为 了 防止 用 户 发 生 这 样 的 事情 ，C 指定 如 果 guess 的 
值 不 是 情况 之 一 ， 那 就 任何 事情 都 不 做 。 它 也 给 switch 语句 提供 了 一 种 default 情况 ， 用 来 
处 理 前 面 没有 出 现 过 的 情况 。 编 译 器 一 定 要 给 guess 生成 一 个 初始 的 条 件 分 支 ， 用 来 处 理 其 
他 情况 没有 覆盖 到 的 值 。 本 章 结尾 的 习题 会 讨论 switch 语句 的 这 个 特性 。 
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234 BORD LRA (FIF) 





‘ 0001le c7 45 £8 01 00 
00 90 
| 00025 eb 09 
$LN2@printBar: 
00027 8b 45 £8 


0002a 83 c0 01 
00024 89 45 f8 
$LN3@printBar: 

00030 8b 45 f8 ~ 
00033 3b 45 08 | 


keL 
mov DWORD PTR x [ebp], 1 


doe) SHORT anita Sannin 
r k 


mov eax, a PTR k$ T 


add eax, 
mov ell PTR _k$lebp], eax 


Iken 
mov eax, DWORD PTR _ks tet! 


cmp eax, DWORD PTR _n$ [ebp] 








Dooe Fe 19 jg SHORT SuNLeprintBar 

: ae D for 循环 的 翻译 
Cee de jmp SHORT iN2eprintBar 
SLN1@printBar: A 

uy Wert a 

图 6-41 ( 续 ) 


”和 Pep/9 代码 清单 一 样 ， 4 -AR 
AEM, 第 二 列 是 十 六 进 制 的 机 器 码 ， 
第 区 ARTARKEN, ai 
一 个 或 多 个 操作 数 。 ae mS 

moxi HS RW HRA, ek 
把 letter 的 值 放 入 EAX 寄存器。 该 语言 
用 PTR 来 表示 操作 数 的 字 节 数 ， 而 不 是 ， 
针对 不 同 大 小 的 操作 数 给 出 不 同 的 mov 
指令 。cmp 是 比较 指令 ， 它 把 EAX 寄存 
器 的 内 容 与 42 (dec), 2A (hex), 也 
就 是 ASCII 字符 *， 进 行 比较 。 和 Pep/9 
”一样 ， 分 号 表示 编译 器 为 代码 清单 生成 
的 注释 的 开始 。 十 六 进 制 常量 用 字母 也 
结尾 。je 是 相等 时 跳 转 指令 ， 它 等 同 于 
blag ag ted E 





| : ence og 
代码 的 一 ANT meee CET 
La n 1 








prtntee (value): 


生成 了 这 段 代码 。 o 
o a a BARRERAE, pubi 
令 自 动 从 术 指 针 ESP PRE 4, “a A 
弹出 模 中 的 这 些 字 节 。 ， ' 











oo 虽然 前 面 的 代码 片 仙 接近 于 对 应 
的 Pep/9 a = (B Æ printBar() F X 的 


设置 代码 要 复杂 得 多 。 除了 本 指 钟 ”还 
AS BRR UH. BEBE 
l printBar() 函数 的 开头 为 文本 段 中 的 形 参 
mn 和 局 部 变量 k 设置 数 值 : 


COMDAT _printBar 
_TEXT SEGMENT | 
k$ = -8 ; Size = 4 
“ng = 8 7 Size = 4 
_printBar PROC ; COMDAT 


“与 Pep/9 不 同 的 是 ， 相 对 于 基 址 指针 
而 不 是 模 指 针 的 偏 移 量 可 以 是 负数 。 函 
， 数 开头 的 设置 代码 需要 九条 指令 ， 这 里 

没有 显示 它们 。 

”图 6-41c 的 代码 片段 是 函数 内 
for (k <= 1; K <= n; k++) 

的 编译 器 翻译 。 ， | 
”第 一 条 语句 把 k 初 始 化 为 1。 
” DWORD 表示 双 字 ， 即 4 个 字 节 。MASM 

。 把 括号 当 作 加 法 运算 符 ， 因此， 表达 
R _kSlebp] 表示 的 是 寻 址 方式 ， 其 操作 
BCE Mem[EBP + OprndSpec], _k$ 的 值 是 
。， 某 个 操作 数 指示 符 。 这 个 寻 址 方式 等 效 于 
”Pep/9 的 栈 相对 寻 址 ， 只 不 过 用 基 址 指针 

”EBP 代替 了 栈 指针 。 

可 以 在 目标 代码 中 看 到 操作 数 指示 
” 符 。 符 号 _k$ 的 值 是 -8 (dec)， 在 目标 代 
。 码 申 为 1111 1000 (bin) RR. AA, 可 
”以 看 到 _n$ 的 值 在 目标 代码 中 为 08。 

“jmp 是 无 条 件 跳 转 ,等 同 于 Pep/9 的 


BR。jg 是 大 于 时 跳 转 ,等 同 于 Pep/9 的 
BRGT。 图 6-41d 中 的 两 条 语句 在 循环 的 
尾部 。 第 一 条 语句 分 支 回 到 测试 ， 第 二 
条 语句 是 终止 循环 的 符号 。 

x86 的 跳 转 指令 使 用 PC 相对 寻 
直 ， 这 是 一 种 常用 寻 址 方式 ， 但 是 为 
了 保持 翻译 的 简单 性 ，Pep/9 没有 使 用 
它 。PC 相对 寻 址 中 ， 操 作 数 指示 符 不 
是 目标 地 址 ， 而 是 从 PC 当前 值 到 目标 
所 需 的 偏 移 量 。 换 和 名 话说， 操作 数 是 
PC+OprndSpec。 


GED 考虑 图 6-41c 中 位 于 00025 
的 jmp 指令 。 指 令 指 示 竺 是 eb， 操 作 数 
指示 符 是 09。 分 支 不 是 到 Mem[09]， 而 
是 到 Mem[PC+09]。 该 指令 被 取 指 后 ， 
程序 计数 器 的 值 增加 。x86 架 构 的 程序 
TARE LEP, 现在 它 的 值 是 00027。 
因此 ,分支 会 到 Mem[00027+09]， 即 
Mem[00030]， 这 里 的 加 法 是 十 六 进 制 
的 。 不 出 所 料 ， 分 支 的 目标 是 $SLN3@ 


6.5 动态 内 存 分 配 


编译 需 的 目的 是 为 程序 员 创造 一 种 高 层次 的 抽象 。 例 如 ， 
环 ， 而 不 是 思考 在 机 器 上 执行 循环 所 必需 的 汇编 层 具体 的 条 件 分 文 。 隐藏 较 低 层次 的 细节 是 


抽象 的 本 质 . 


但 程序 控制 的 抽象 仅仅 是 问题 的 一 面 ， 另 一 


的 数据 类 型 是 位 和 字 节 。 


在 运行 时 栈 上 分 配 。 但 是 


C 程序 还 能 包含 结构 和 指针 ， 
HOL6 层 . 指针 访问 用 malloc() 函数 在 堆 上 分 配 的 结构 。 
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printBar:， 其 地 址 为 00030。 8 


考虑 图 6-41d 中 位 于 0004f 


的 jmp 指令 。 该 指令 被 取 指 后 ， 程 序 计 
数 器 的 值 增 加 ， 现 在 它 的 值 是 00051。 从 
目标 代码 清单 可 以 看 出 来 ， 操 作 数 指示 
符 是 d6。 它 被 看 作 是 一 个 8 位 有 符号 数 
11010110, 符号 位 是 1, 


(dec) 加 到 00051 (hex) 上 ， 得 到 十 六 进 
制 地 址 00027。 和 和 预期 的 一 样 ， 分 支 目标 
Æ $LN2@printBar:, H mé 6-410 中 的 地 
址 00027。 


fo Pepi) 一 样 ，x86 架构 描述 了 一个 
“复杂 指令 集 (CISC) 机 器 。 从 前 面 的 目 


标 代码 可 以 看 出 来 ，x86 指令 有 许多 不 同 
的 大 小 。 第 12 章 描述 了 MIPS 机 器 ， 它 
是 精简 指令 集 (RISC) 机 器 。RISC 机 器 
的 主要 设计 目标 是 所 有 指令 具有 相同 的 
大 小 。 第 12 章 展示 了 MIPS 机 器 如 何 为 


其 分 支 指令 使 用 PC 相对 寻 址 。 o 


面 是 数据 的 抽象 。 在 汇编 层 和 机 器 层 ， 唯 一 
前 面 的 程序 展示 了 编译 器 怎样 翻译 字符 、 整 数 和 数组 这 些 数据 类 
型 ， 这 些 类 型 中 的 每 一 种 都 可 以 是 全 局 的 ， 使 用 .BLOCK 分 配 ; 或 者 是 局 部 的 ,用 SUBSP 
这 是 许多 数据 结构 的 基本 构件 。 在 
本 节 展 示 一 个 Asmb5 层 上 简单 的 


堆 操作 ， 以 及 编译 器 怎样 翻译 包含 指针 和 结构 的 程序 


6.5.1 翻译 全 局 指针 


图 6-42 展示 了 一 个 有 全 局 指针 的 C 程序 ， 


序 和 图 2-38 中 的 程序 是 一 样 的 。 


以 及 它 到 Pep/9 汇编 语言 的 翻译 。 
图 2-39 展示 了 FEFE HOL6 层 上 执行 时 堆 的 分 配 。 堆 是 


不 同 于 栈 的 内 存 区 域 。 编 译 器 ， 与 操作 系统 合作 ， 必 须 生 成 执行 堆 分 配 和 释放 的 代码 。 


表示 它 是 负数 ， 
即 -42(dec)。 用 适当 的 基数 转换 ,把 -42 


它 让 程序 员 思 考 单个 while 循 


这 个 C 程 
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高 级 语言 
#include <stdio.h> 
#include <stdlib.h> 


int *a, *b, *c; 


int main() { 


(int *) malloc (sizeof (int) ); 
ta = 5; 

(int *) malloc (sizeof (int) ); 
*b = 3; 


printf£("*a = %d\n", *a); 
printf ("*b = %d\n", *b); 
printf ("*c = d\n", *c); 
return 0; 


} 
汇编 语言 
0000 120009 
0003 0000 : ;global variable #2h 
0005 0000 b: ;global variable #2h 
0007 0000 c: ¡global variable #2h 
pera eee 
C00002 main: Zoi ja = (int *) malloc (sizeof (int) ) 
240073 malloc ;allocate #2d 
E90003 a,d 
C00005 Bi 
E20003 a,n 
C00002 2,2 7b = (int *) malloc(sizeof (int) ) 
240073 malloc jallocate #2d 
E90005 b,d 
C00003 Syd 
E20005 b,n 
C10003 a,d 
E10007 c,d 
c10005 b,d 
E10003 a,d 
C00002 23 
620007 en 
E20003 a,n 
490061 msg0,d printf ("+a = 
3A0003 a,n 
DOOOOA An’, i 
F1FC16 charOut,d 
490067 msgi,d ¿printf ("*b = $d\n", *b) 
3A0005 b,n 
DOOOOA hn, £ 
F1FC16 charOut,d 


图 6-42 全 局 指针 的 翻译 。 这 个 C 程序 来 自 图 2-38 
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49006D msg2,d pprint£("*c = d\n", *c) 
3A0007 cn 

DOOOOA Ub Ss oi 
F1FC16 charOut,d 
00 

2A6120 msg0: n. \xoo" 
3D2000 

2A6220 msgl : 有 \x00" 
3D2000 

2A6320 msg2: j \x00" 
3D2000 


+ 
;***xxx*x* malloc () 


Precondition: A contains number of bytes 
; Postcondition: X contains pointer to bytes 

C9007D malloc: LDWX hpPtr,d ;returned pointer 
61007D hpPtr,d jallocate from heap 
E1007D hpPtr,d ;update hpPtr 
01 
007F hpPtr: .ADDRSS heap jaddress of next free byte 
00 heap: .BLOCK 1 ;first byte in the heap 

. END 





K| 6-42 (42) 


当 在 C 中 用 指针 编程 时 ， 要 用 malloc) 函数 在 堆 上 分 配 存储 空间 。 当 程序 不 再 需要 这 
些 存储 空间 时 ， 用 free) 函数 释放 它们 。 有 可 能 在 堆 上 分 配 多 个 内 存单 元 ， 再 从 中 间 释 放 一 
个 单元 。 内 存 管理 算法 必须 能 够 处 理 这 种 情形 。 本 书 只 是 人 门 级 介绍 ， 为 了 描述 简单 ， 这 里 
使 用 的 说 明 扒 的 程序 不 显示 释放 过 程 。 堆 位 于 主 存 中 应 用 程序 的 末尾 。 函 数 malloc() 在 堆 上 
分 配 存储 空间 ， 因 此 堆 是 向 下 生长 的 。 一 旦 内 存 被 分 配 了 ， 就 不 会 被 释放 。Pep/9 的 这 个 属 
性 是 不 切实 际 的， 但 是 比 描述 实际 情况 更 易于 理解 。 

图 6-42 中 的 汇编 语言 程序 展示 了 堆 从 007F 开始 ， 这 是 符号 heap 的 值 。 分 配 算法 维护 
一 个 叫 作 hpPtr 的 全 局 指针 ， 它 代表 堆 指针 。 语 句 


007D 007F hpPtr: .ADDRSS heap ;address of next free byte 


将 hpPtr 初始 化 为 当前 堆 中 第 一 个 字 节 的 地 址 。 应 用 程序 向 malloc) 提供 需要 的 字 节 数 ， 
malloc() 函数 返回 hpPtr 的 当前 值 ， 然 后 把 hpPtr 加 上 请 求 的 字 节 数 。 因 此 malloc() 函数 保 
证 hpPtr 总 是 指向 在 堆 中 下 一 个 可 以 被 分 配 字 节 的 地 址 。 

函数 malloc() 的 调用 协议 不 同 于 其 他 函数 的 调用 协议 。 对 于 其 他 函数 ,信息 通过 运行 时 
栈 上 的 参数 进行 传递 ， 而 对 于 malloc) 函数 ， 应 用 程序 把 要 分 配 的 字 节 数 放 入 累加 器 ， 再 执 
行 CALL 语句 去 调用 malloc) RAL. malloc() 函数 为 应 用 程序 把 当前 的 hpPtr 值 放 入 变 址 寄 
存 器 ， 因 此 成 功 执行 malloc) 的 前 提 条 件 是 累加 器 中 包含 要 在 堆 上 分 配 的 字 节 数 ， 后 置 条 件 
是 变 址 寄存 器 包含 malloc() 要 在 堆 上 分 配 的 第 一 个 字 节 的 地 址 。 
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malloc() PASH Pal FA BUS Le A {th pK HY AF BE ey. malloc() 的 实现 只 要 4 行 汇编 
语言 代码 ,包括 RET 语句 。 语 名 


0073 C9007D malloc: LDWX hpPtr,d ;returned pointer 


把 堆 指 针 的 当前 值 放 人 变 址 寄存 器 。 语 名 


0076 61007D ADDA hpPtr,d ;allocate from heap 


给 堆 指 针 加 上 要 分 配 的 字 节 数 。 语 句 
0079 E1007D STWA hpPtr,d ;update hpPtr 


把 hpPtr 更 新 为 堆 上 第 一 个 未 分 配 字 节 的 地 址 。 

这 个 调用 协议 高 效 有 两 个 原因 。 首 先 ， 它 没有 像 其 他 函数 那样 很 长 的 参数 列表 ， 应 用 
程序 只 需 向 malloc() 提供 一 个 值 。 而 其 他 函数 的 调用 协议 必须 设计 成 能 够 处 理 任意 数量 的 参 
数 。 比 如 ， 如 果 参 数列 表 有 4 个 参数 ， 那 么 Pep/9 的 CPU 中 就 没有 足够 的 寄存 器 来 全 部 保 
存 它们 ， 但 是 运行 时 栈 可 以 存储 任意 数量 的 参数 。 其 次 , malloc() 不 会 调用 任何 其 他 的 函数 ， 
尤其 是 没有 递归 调用 。 函 数 的 调用 协议 一 般 来 说 要 设计 成 允许 函数 调用 其 他 函数 ， 或 者 递归 
地 调用 函数 自身 ， 这 样 的 调用 必须 要 使 用 运行 时 栈 ,但 是 对 于 malloc) 来 说 是 不 必要 的 。 

图 6-43a 展示 了 这 个 HOL6 层 的 C 程序 在 第 一 个 printf() 语句 之 前 的 内 存 分 配 ， 它 对 应 
于 图 2-39h。 图 6-43b 展示 了 AsmbS 层 上 同样 的 内 存 分 配 。 全 局 指针 a、b 和 c 分别 存储 在 
0003. 0005 和 0007。 与 所 有 的 全 局 变量 一 样 ， 用 .BLOCK 语句 对 它们 进行 分 配 


0003 0000 a: .BLOCK 2 ;global variable #2h 

0005 0000 b: .BLOCK 2 ;global variable #2h 

0007 0000 c: .BLOCK 2 ;global variable #2h 

HOL6 层 的 指针 就 是 Asmb5 层 的 地 址 ， 地 址 占用 2 字 节 ， 因 此 给 每 个 全 局 指针 分 配 2 
字 节 。 指 针 有 格式 跟踪 标签 #2h， 因 为 指针 是 地 址 且 一 般 以 十 六 进 制 表示 。 


0003 a 
oos Fonsi | > 
0007 | 007F | € 
a 
5 
c 0081 
a) HOL6 层 的 全 局 指针 b) Asmb5 层 上 同样 的 全 局 指针 
图 6-43 图 6-42 的 内 存 分 配 ， 正 好 在 执行 第 一 条 printf) 语句 之 前 
编译 器 把 语句 
a = (int *) malloc (sizeof (int) ); 
翻译 成 
0009 C00002 main: LDWA 2,i ja = (int +) malloc .. 
000C 240073 CALL malloc ;allocate #2d 
OOOF E90003 STWX a,d 


LDWA 指令 把 2 放 入 累加 器 。CALL 指令 调用 malloc() eX, malloc) 函数 在 堆 上 分 
配 2 字 节 的 存储 空间 ， 再 把 指向 已 分 配 空间 的 指针 放 到 变 址 寄存 器 中 。 注 释 有 格式 跟踪 标签 
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#2d， 因 为 a 指向 的 单元 包含 了 一 个 两 字 节 的 十 进 制 数 。STWX 指令 把 返回 的 指针 存储 在 全 
局 变量 a 中 。 因 为 a 是 全 局 变量 ， 所 以 STWX 使 用 直接 寻 址 。 在 这 一 系列 指令 执行 之 后 ，a 
的 值 是 007F ，hpPtr 的 值 是 0081， 因 为 它 增加 了 2. 

编译 器 怎样 翻译 下 面 这 条 语句 呢 ? 


*¥a = 5; 


当 程 序 执行 到 此 ， 全 局 变量 a 存 放 的 是 存储 5 的 内 存 地 址 (这 个 执行 点 不 对 应 于 
图 6-43， 它 是 后 面 的 情况 )。 字 存储 指令 不 能 使 用 直接 寻 址 把 $ 放 入 a， 因 为 这 样 会 把 地 址 
替换 为 5，5 不 是 堆 上 已 分 配 单元 的 地 址 。Pep/9 提供 间接 寻 址 方式 ， 操 作 数 是 这 样 计算 的 : 
Oprnd = Mem [Mem[OprndSpec]] 
使 用 间接 寻 址 ， 操 作 数 指示 符 是 内 存 中 操作 数 的 地 址 。 编 译 器 把 赋值 语句 翻译 为 


0012 C00005 LDWA 5,i yxa = 5 
0015 £20003 STWA a,n 
字 存 储 指令 (STWA) 中 的 nm 表示 间接 寻 址 。 程 序 此 时 这 样 计算 操作 数 
Mem[Mem[OprndSpec]] 
Mem[Mem[0003]] 
Mem[007F] 
这 就 是 堆 上 的 第 一 个 单元 。 字 存储 指令 把 5 存储 在 主 存 中 地 址 为 007F 的 位 置 。 
编译 器 对 全 局 指针 赋值 的 翻译 与 对 任何 其 他 类 型 全 局 变量 赋值 的 翻译 是 一 样 的 。 它 用 间 
接 寻 址 把 


翻译 为 

0027 C10003 LDWA ad ;Cc = a 

002A £10007 STWA c,d 

程序 在 此 时 ，a 包含 007F， 即 堆 上 第 一 个 单元 的 地 址 。 赋 值 语句 赋 给 c IRR, BOE 
上 第 一 个 单元 的 地 址 ， 所 以 c 指向 a 指向 的 同一 单元 。 

对 比 访问 全 局 指针 和 访问 它 指向 的 单元 。 编 译 器 将 

wa = 2 + Wo; 
翻译 为 

0033 C00002 LDWA 2,i j;*a = 2 + *c 

0036 620007 ADDA c,n 

0039 E20003 STWA a,n 

这 里 加 法 和 字 存 储 指令 使 用 间接 寻 址 方式 。 访 问 全 局 指针 使 用 直接 寻 址 ， 而 访问 全 局 指 
针 指 向 的 单元 使 用 间接 寻 址 。 可 以 看 到 同样 的 规则 适用 于 printf 语句 的 翻译 。 因 为 printf() 
输出 *a， 即 a 指 向 的 单元 ， 所 以 003F 的 DECO 指令 使 用 间接 寻 址 。 

总 之 ， 为 了 翻译 全 局 指针 ， 编 译 器 遵循 如 下 规则 生成 代码 :; 

e 用 .BLOCK 2 给 指针 分 配 存储 空间 ， 因 为 一 个 地 址 占用 2 字 节 。 

e 用 直接 寻 址 的 LDWA 访问 指针 。 

e 根据 间接 寻 址 访问 单元 中 的 类 型 ， 生 成 LDWA 或 LDBA 以 获得 指针 指向 的 单元 内 容 。 


240 PROBED LR (FSF) 


6.5.2 ”翻译 局 部 指针 


除了 指针 a、b 和 声明 为 局 部 变量 而 不 是 全 局 变量 外 ， 图 6-44 中 的 程序 与 图 6-42 中 的 
程序 是 一 样 的 。 这 两 个 程序 的 输出 没有 什么 不 同 ， 但 是 内 存 模型 是 完全 不 同 的 ， 因 为 这 个 程 
序 的 指针 是 在 运行 时 栈 上 分 配 的 。 


高 级 语言 


#include <stdio.h> 
#include <stdlib.h> 


int main() { 


int *a, *b, *c; 

(int *) malloc (sizeof (int) ) ; 
*a = 5; 

(int *) malloc (sizeof (int)); 
wb = 3; 


2 + *c; 
printf ("*a = d\n", *a); 
printf ("*b = d\n", *b); 
printf (ve = %d\n", *c); 
return 0; 
363 } 
汇编 语言 
0000 120003 BR 
KKK main () 
. EQUATE ;local variable #2h 
. EQUATE ;local variable #2h 
a . EQUATE ;local variable #2h 
580006 SUBSP i ;push #a #b #c 
C00002 LDWA i ja = (int *) malloc(sizeof (int) ) 
240073 CALL jallocate #2d 
EBO004 STWX 
C00005 LDWA 
E40004 STWA 
co0002 LDWA i 7b = (int *) malloc (sizeof (int) ) 
240073 CALL jallocate #2d 
EBO002 STWX 
c00003 
E40002 STWA 
c30004 
E30000 STWA 
C30002 
E30004 STWA 
C00002 
640000 
E40004 
490061 ;printf ("*a = %d\n", *a) 





图 6-44 局 部 指针 的 翻译 


3c0004 
DOOOOA 
F1FC16 
490067 
3c0002 
DOOOOA 
FlFC16 
49006D 
3C0000 
DOOOOA 
F1FC16 
500006 
00 

2A6120 
3D2000 
2A6220 
3D2000 
246320 
3D2000 


C9007D 
61007D 
E1007D 
01 
007F 
00 


int *a, *b, *c; 


翻译 为 
a: .EQUATE 4 


-EQUATE 2 
C: .EQUATE 0 


Si PEE HS 


phe RR Re 
; 
’ 


malloc: 


hpPtr: 
heap: 


malloc () 


a,sf 
int 让 
charOut,d 
msgl1,d 
b,sf 
N\nt, 2 
charOut,d 
msg2,d 
c,sf 
"\n' ,i 
charOut,d 
6,i 


"eq = \xoo" 


"kb = Nx00" 


"ko = \xoo" 
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;printf ("*b = %d\n", *b) 


¡printf ("*c = td\n", *c) 


jpop #c #b #a 


Precondition: A contains number of bytes 


Postcondition: X contains pointer to bytes 


LDWX 
ADDA 
STWA 
RET 


hpPtr,d 
hpPtr,d 
hpPtr,d 


-ADDRSS heap 
.BLOCK 1 


-END 





;returned pointer 
;allocate from heap 
;update hpPtr 


;address of next free byte 
;first byte in the heap 


图 6-44 (4) 


图 6-45 展示 了 图 6-44 中 程序 在 执行 第 一 条 printh) 语句 前 的 内 存 分 配 ， 与 所 有 局 部 变 
量 一 样 ，a、b 和 c 在 运行 时 栈 进行 分 配 。 图 6-44b 显示 了 它们 距 栈 项 的 偏 移 量 分 别 为 4、2 
和 0。 因此， 编译 器 将 


;local variable #2h 
;local variable #2h 


;local variable #2h 


因为 a、b Alc 是 局 部 变量 ， 所 以 编译 器 用 SUBSP 给 它们 生成 分 配 存储 空间 的 代码 ， 用 
ADDSP 生成 释放 存储 空间 的 代码 。 


a = (int *) malloc(sizeof (int)); 


翻译 为 


0006 C00002 LDWA 2,i 


;a= (int *) malloc (sizeof (int) ) 


365 
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0009 240073 CALL malloc ;allocate #2d 
000C EB0004 STWX a,s 


c [5] SP —> 0 

b 2 

a [7] 4 
7 


a) HOL6 层 的 局 部 指针 b) Asmb5 层 上 同样 的 局 部 指针 
图 6-45 图 6-44 的 内 存 分 配 ， 正 好 在 执行 第 一 条 printfO 语句 之 前 


LDWA 指令 把 2 放 和 人 累加 器 ， 为 调用 malloc() 函数 做 准备 ， 放 入 2 是 因为 整数 占用 2 
字 节 。CALL 指令 调用 malloc(), malloc) 在 堆 上 分 配 2 字 节 ， 把 它们 的 地 址 放 进 变 址 寄存 器 。 
一 般 来 说 ， 给 局 部 变量 赋值 用 栈 相 对 寻 址 ， 因 此 STWX 语句 用 栈 相 对 寻 址 把 这 个 地 址 赋值 
给 as 

编译 器 怎样 翻译 下 面 这 个 赋值 呢 ? 


*a = 5; 


a 是 指针 ， 把 a 指向 的 单元 赋值 为 5。a 也 是 一 个 局 部 变量 。 这 种 情形 与 图 6-27 和 图 6-29 中 
程序 的 传 引 用 调用 参数 一 样 ， 即 操作 数 的 地 址 在 运行 时 栈 上 。 编 译 器 把 赋值 语句 翻译 为 
000F co0005 LDWA 5,i j;*a=5 
0012 40004 STWA a,sf 
这 里 ， 存 储 指令 使 用 栈 相对 间接 寻 址 。 
编译 器 对 局 部 指针 赋值 的 翻译 与 对 任何 其 他 类 型 的 局 部 变量 赋值 的 翻译 是 一 样 的 。 它 使 
用 栈 相 对 寻 址 把 


Cc =a; 
0024 C30004 LDWA a,s ae 
0027 E30000 STWA c,s 


这 时 在 程序 中 ，a 包含 007F， 即 堆 上 第 一 个 单元 的 地 址 。 赋 值 语句 给 同样 的 值 ， 即 堆 上 第 
一 个 单元 的 地 址 ， 所 以 c 指向 a 指向 的 同一 单元 。 

编译 器 将 

ta = 2 + C} 
翻译 为 

0030 C00002 LDWA 2,i 7*a = 2 + te 

0033 640000 ADDA c,sf 

0036 E40004 STWA a,sf 
这 里 加 法 指令 使 用 栈 相对 间接 寻 址 来 访问 c 指 向 的 单元 ， 存储 指令 使 用 栈 相对 间接 寻 址 来 
访问 a 指向 的 单元 。 同 样 的 规则 适用 于 printf() 语句 ， 这 里 DECO 指令 也 使 用 栈 相对 间接 
寻 址 。 





" 
w 
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总 之 ， 为 了 访问 局 部 指针 ， 编 译 器 遵循 如 下 规则 生成 代码 : 

e 给 指针 分 配 存储 空间 时 ， 为 每 个 指针 生成 带 两 个 字 节 的 SUBSP， 因 为 一 个 地 址 占 两 
个 字 节 。 

o 用 栈 相 对 寻 址 的 LDWA 访问 指针 。 

o 用 栈 相 对 间接 寻 址 的 LDWA 获得 指针 指向 的 单元 。 


6.5.3 ”翻译 结构 


在 HOL6 层 ， 高 级 语言 层 ， 结 构 是 数据 抽象 的 关键 。 它 允许 程序 员 把 原始 类 型 的 变量 整 
合 为 一 个 抽象 数据 类 型 。 编 译 器 在 HOL6 层 提供 struct 结构 。 在 Asmb5 汇编 层 ， 结 构 是 一 
个 连续 的 字 节 组 ， 非 常 像 数组 字 节 。 但 是 数组 的 所 有 单元 都 具有 相同 的 类 型 ， 因 此 具有 相同 
的 大 小 ， 通 过 索引 的 整数 值 来 访问 每 个 单元 。 

使 用 结构 ， 单 元 可 以 有 不 同 的 类 型 和 不 同 的 大 小 。C 程序 员 给 每 个 称 为 字段 的 单元 一 个 
FRA. E Asmb5 层 ， 字 段 名 对 应 于 该 字段 距离 结构 第 一 个 字 节 的 偏 移 量 。 结 构 的 字段 名 
对 应 于 数组 的 索引 。 访 问 结构 的 字段 与 访问 数组 的 元 素 类 似 ， 这 也 就 一 点 都 不 奇怪 了 。 编 译 
器 不 是 把 数组 的 索引 放 入 变 址 寄存 器 ， 而 是 生成 代码 把 字段 距离 结构 第 一 个 字 节 的 偏 移 量 放 
入 变 址 寄存 器 。 除 了 这 一 点 不 同 外 ， 访 问 结构 字段 的 代码 和 访问 数组 元 素 的 代码 是 一 样 的 。 

6-46 中 的 程序 ， 声 明了 一 个 叫 作 person 的 struct, person 有 4 个 字段 ，first last, 
age 和 gender。 它 和 图 2-40 中 的 程序 是 一 样 的 。 它 声明 了 一 个 叫 作 bill 的 全 局 变量 ，bil 
的 类 型 是 person。 图 6-47 展示 了 这 个 结构 在 HOL6 层 和 Asmb5 层 的 存储 空间 分 配 。 字 段 
first, last 和 gender 的 类 型 是 char， 每 个 字段 占用 1 字 节 ， 字 段 age 的 类 型 是 int， 占 用 2 字 
节 。 图 6-47b 给 出 了 结构 每 个 字段 的 地 址 ， 地 址 左边 是 距离 结构 第 一 个 字 节 的 偏 移 量 。 除 了 
没有 对 应 于 SP 的 到 结构 顶部 的 指针 外 ， 结 构 的 偏 移 量 类 似 于 栈 上 元 素 的 偏 移 量 。 


高 级 语言 


#include <stdio.h> 


struct person { 
char first; 
char last; 
int age; 
char gender; 
hi 


struct person bill; 


int main() { 
scanf ("Sc%c%d %c", &bill.first, &bill.last, &bill.age, &bill.gender) ; 
printf ("Initials: tc%c\n", bill.first, bill.last) ; 
printf ("Age: d\n", bill.age) ; 


printf ("Gender: "); 

if (bill.gender == 'm') { 
printf ("male\n") ; 

} 


else { 





printf ("female\n") ; 


图 6-46 结构 的 翻译 。 该 C 程序 来 自 图 2-40 
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汇编 语言 


0000 


120008 


000000 
0000 


pRERKRKKE 
C80000 main: 
D1FC15 
F50003 
C80001 
D1FC15 
F50003 
C80002 
350003 
C80004 
D1FC15 
F50003 
49006C 
C80000 
D50003 
F1FC16 
C80001 
D50003 
F1FC16 
D0000A 
F1FC16 
490077 
C80002 
3D0003 
DOOOOA 
F1FC16 
49007D 
C80004 
D50003 
B0006D 
1A0068 
490086 
12006B 
49008C else: 
00 endIf: 
496E69 msg0: 


BR 

. EQUATE 
. EQUATE 
- EQUATE 
. EQUATE 
.BLOCK 


main () 
LDWX 
LDBA 
STBA 
LDWX 
LDBA 


STRO 
BR 
STRO 
STOP 
-ASCII 


main 


0 


1 
2 
4 
5 


¡struct 
struct 
¡struct 
¿struct 


field #1c 
field #ic 
field #2d 
field #1c 


;globals #first #last #age #gender 


first,i 


chariIn,d 
bill,x 
last,i 


charin,d 
Hiri, 
age, i 
bill,x 
gender,i 


chariIn,d 
bill ;x 
msg0,d 


first,i 
bill,x 
charOut,d 
last,i 
ball 2 
charOut,d 
"rath 
charOut,d 
msgl,d 


age,i 
bill,x 
Yin di 
charOut,d 
msg2,d 


gender, i 
bill,x 
tm sd 


else 
msg3,d 
endIf 
msg4,d 


"Initials: 


;scanf ("Sc%ctd Sc", 
;&bill.first, 


;&bill.last, 


;&bill.age, 


;&bill.gender) 


;printf("Initials: %c%c\n", 
;bill.first, 


;bill.last) 


;printf ("Age: d\n", 
;bill .age) 


;printf ("Gender: ") 
;if (bill.gender == 


;printf ("male\n") 


;printf ("female\n") 


\x00" 





图 6-46 ( 续 ) 
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0077 416765 = . "Age: \x00" 


007D 47656E 3 x "Gender: \x00" 


0086 6D616C : x "male\n\x00" 


008C 66656D : ` "female\n\x0o" 


0094 . 369 


输入 
bj 32 m 


输出 
Initials: bj 
Age: 32 
Gender: male 





图 6-46 (#2) 





bill.first 0 
bill.last 1 
bill.age 2 
bill.gender 4 


a) HOL6 层 的 全 局 结构 b) Asmb5 层 上 同样 的 全 局 结构 
图 6-47 6-46 的 内 存 分 配 ， 正 好 在 scanf() 语句 之 后 
编译 器 用 .EQUATE 点 命令 把 


struct person { 
char first; 


char last; 
int age; 
char gender; 
}; 
翻译 为 
first: -EQUATE 0 ;struct field #1c 
last: -EQUATE 1 ;struct field #1c 
age: .EQUATE 2 ;struct field #2d 


gender: .EQUATE 4 ;struct field #ic 


字段 名 等 于 字段 距离 结构 first 字 节 的 偏 移 量 。 因 为 first 是 结构 的 第 一 个 字 节 ， 所 以 first 等 
于 0。 由 于 first 占用 1 字 节 ， 所 以 last 等 于 1。 因 为 first 和 1last 共 占用 2 字 节 ， 所 以 age 等 
于 2。gender 等 于 4， 因 为 first、last 和 age 总 共 占 用 4 字 节 。 编 译 器 把 全 局 变量 


person bill; 
0003 000000 bill: .BLOCK 5 ;globals #first #last... 
0000 


要 访问 全 局 结构 的 字段 ， 编 译 器 生成 代码 ， 把 字段 距离 结构 第 一 个 字 节 的 偏 移 量 装 入 变 
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址 寄存 器 ， 就 像 用 变 址 寻 址 方式 访问 全 局 数组 的 单元 一 样 ， 用 同样 的 方式 访问 结构 的 字段 。 
例如 ， 编 译 器 把 对 &bill.age 的 scanf) 翻译 为 


001A C80002 LDWX age,i ;&bill.age, 
001D 350003 DECI bill,x 


装 入 指令 用 立即 数 寻 址 把 字段 age 的 偏 移 量 装 人 变 址 寄存 器 ， 十 进 制 输入 指令 用 变 址 寻 址 来 
访问 这 个 字段 。 


编译 器 类 似 地 把 
if (bill.gender == 'm') 
翻译 为 
0056 C80004 LDWX gender,i ;if (bill.gender == 'm') 


0059 D50003 LDBA bill,x 

005C BOOO6D CPBA 'm',i 
字 装 人 指令 把 gender 字段 的 偏 移 量 装 人 变 址 寄存 器 。 字 节 装 人 指令 用 变 址 寻 址 方式 访问 结 
构 的 字段 ， 并 把 它 放 人 累加 器 最 右 的 字 节 。 最 后 ， 比 较 指 令 比 较 bill.gender 和 字母 m。 

总 之 ,为 了 访问 一 个 全 局 结构 ， 编 译 咒 遵循 如 下 规则 生成 代码 ; 

e 结构 的 每 个 字段 等 于 它 距离 结构 第 一 个 字 节 的 偏 移 量 。 

e 用 .BLOCK tot 给 结构 分 配 存储 空间 ，tot 是 结构 占用 的 总 字 节 数 。 

e 通过 生成 用 立即 数 寻 址 的 LDWX 把 字段 的 偏 移 量 装 人 变 址 寄存 器 ， 后 面 跟 一 条 使 用 

变 址 寻 址 方式 的 LDBA 或 LDWA 指令 来 获得 结构 的 字段 。 

访问 全 局 结构 的 字段 类 似 于 访问 全 局 数组 的 元 素 ， 与 此 方式 相同 ， 访 问 局 部 结构 的 字段 
类 似 于 访问 局 部 数组 的 元 素 。 局 部 结构 在 运行 时 栈 上 分 配 ， 每 个 字段 的 名 字 等 于 它 距离 结构 
第 一 个 字 节 的 偏 移 量 ， 局 部 结构 的 名 字 等 于 它 距离 栈 顶 的 偏 移 量 。 编 译 器 生成 SUBSP 给 结 
构 和 任何 其 他 局 部 变量 分 配 存 储 空间 ，ADDSP 释放 存储 空间 。 通 过 用 立即 数 寻 址 方式 把 字 
段 的 偏 移 量 装 人 变 址 寄存 器 中 ， 后 面 跟 一 个 使 用 栈 变 址 寻 址 方式 的 指令 来 访问 结构 的 字段 。 
本 章 后 面 有 一 道 给 学 生出 的 习题 ， 要 求 翻译 一 个 有 局 部 结构 的 程序 。 


6.5.4 翻译 链 式 数据 结构 


程序 员 经 常 把 指针 和 结构 结合 在 一 起 来 实现 链 式 数据 结构 。struct 通常 称 为 结 点 ， 指 针 
指向 结 点 ， 结 点 有 一 个 指针 字段 。 在 数据 结构 中 ， 结 点 的 指针 字段 作为 到 男 一 个 结 点 的 链 
接 。 图 6-48 是 一 个 实现 了 链 式 数据 结构 的 程序 ， 它 和 图 2-42 的 程序 是 一 样 的 。 


高 级 语言 
#include <stdio.h> 
#include <stdlib.h> 


struct node { 
int data; 
struct node *next; 


F? 


int main() { 





图 6-48 ”链表 的 翻译 。 该 C 程序 来 自 图 2-42 
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struct node *first, 
int value; 
first: = 
scanf ("%d", &value) ; 
while (value != -9999) { 
p = first; 
first = (struct node *) malloc (sizeof (struct node) ); 
first->data = value; 
first->next = p; 
scanf("%d", &value); 


} 
for (p = first; p != 0; p = p->next) { 
printf("%d ", p->data) ; 


} 


return 0; 


} 372 


汇编 语言 
0000 120003 BR 
data: . EQUATE ;Struct field #2d 
next: - EQUATE ;struct field #2h 
i 
pee eee main () 
first: . EQUATE jlocal variable #2h 
p: . EQUATE jlocal variable #2h 
value: . EQUATE ;local variable #2d 
580006 main: SUBSP 6,1 ;push #first #p #value 
C00000 LDWA 0,i ;first = 0 
E30004 STWA first,s 
330000 DECI value,s ;scanf("%d", &value) ; 
c30000 LDWA value,s ;while (value != -9999) 
AODS8F1 CPWA -9999,i 
18003F BREQ endwh 
C30004 LDWA first,s ;BD = first 
E30002 STWA pis 
CO0004 LDWA 4,i zírat = (nc) mallo. =) 
24006A CALL malloc ;allocate #data #next 
EB0004 STWX first,s 
C30000 value,s ;first->data value 
C80000 data,i 
E70004 first,sfx 
C30002 ps ;first->next 
C80002 next, i 
E70004 first,sfx 
330000 value,s ¡scanf ("%d", &value) 
12000F while 
C30004 first,s ifor (p = first 
E30002 ps 
C30002 $ p,s 7p 
A00000 0,ä 





图 6-48 ( 续 ) 
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180066 endFor 
C80000 data,i ;printf ("td ", p->data) 
3F0002 p, sfx 
D00020 YS 
F1FC16 charOut,d 
c80002 next,i iP = p->next) 
373 C70002 p, sfx 

E30002 p.s 
120045 for 
500006 endFor: ADDSP 6,1 ;POP #value #p #first 
00 STOP 

¿**ž*ž*x*x*x* malloc() 

; Precondition: A contains number of bytes 

; Postcondition: X contains pointer to bytes 
C90074 malloc: LDWX hpPtr,d ;returned pointer 
610074 ADDA hpPtr,d ;allocate from heap 
E10074 STWA hpPtr,d ;Update hpPtr 
01 RET 
0076 hpPtr: .ADDRSS heap address of next free byte 
00 heap: .BLOCK 1 ;first byte in the heap 

. END 


输入 
10 20 30 40 -9999 


输出 


40 30 20 10 





6-48 ( 续 ) 
编译 器 把 结构 的 字段 


struct node { 
int data; 
node* next; 


ha 
设置 为 它们 距离 struct 第 一 个 字 节 的 偏 移 量 ，data 是 第 一 个 字段 ， 偏 移 量 是 0, next 是 第 二 
个 字段 ， 偏 移 量 为 2， 因为 data 占用 了 2 字 节 。 翻 译 为 
data: .EQUATE 0 ;struct field #2d 
374 next: .EQUATE 2 ;struct field #2h 
编译 器 像 翻译 所 有 局 部 变量 一 样 翻译 这 些 局 部 变量 
node *first, *p; 
int value; 
它 把 变量 名 设置 为 距离 运行 时 栈 顶 部 的 偏 移 量 ， 翻 译 为 
first: .EQUATE 4 ;local variable #2h 


p: .EQUATE 2 ;local variable #2h 
value: .EQUATE 0 ;local variable #2d 


图 6-49b 展示 了 这 些 局 部 变量 的 偏 移 量 。 编 译 器 在 0003 生成 SUBSP， 给 局 部 变量 分 配 
存储 空间 ， 在 0063 的 ADDSP 释放 存储 空间 。 
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0076 
0078 
007A 
007C 
007E 
0080 


value 30 
| 30 | SP —> 0 FB89 


p | 2 FB8B 
sr 4 BRD 
= 7 
a) HOL6 层 的 链表 b) Asmbs 层 上 同样 的 链表 
图 6-49 图 6-48 的 内 存 分 配 ， 正 好 在 从 输入 流 扫描 40 之 前 。 
当 在 C 中 使 用 malloc() 时 ， 计 算 机 必须 在 堆 上 分 配 足够 的 内 存 来 存储 指针 指向 的 条 目 。 
在 这 个 程序 中 ,一 个 结 点 占用 4 字 节 ， 因 此 ， 编 译 器 通过 在 它 生 成 的 代码 中 调用 malloc() 分 
配 4 字 节 来 将 





first 


first = (struct node *) malloc (sizeof (struct node) ) ; 
001E C00004 LDWA 4,i ;first = (struct node *) ... 


0021 24006A CALL malloc jallocate #data #next 

0024 EB0004 STWX first,s 

在 准备 调用 malloc() 时 ， 字 装 入 指令 把 4 放 入 累加 器 ， 调 用 指令 调用 malloc(), malloc() 
把 被 分 配 结 点 的 第 一 个 字 节 的 地 址 放 和 人 变 址 寄存 器 。 当 分 配 一 个 结构 时 ， 要 提供 各 个 字段 的 
符号 跟踪 标签 ， 符 号 调试 器 会 使 用 这 些 标签 ， 在 此 情况 下 ， 就 是 #data 和 加 ext。 字 存储 指 
令 用 栈 相对 寻 址 完成 给 局 部 变量 first 赋值 。 

编译 器 是 怎样 生成 访问 局 部 指针 所 指向 的 结 点 字段 的 代码 呢 ? 记 住 指针 是 一 个 地 址 ， 局 
部 指针 意味 着 结 点 的 地 址 在 运行 时 栈 上 。 此 外 ，struct 的 字段 对 应 于 数组 的 索引 。 如 果 数 组 
第 一 个 单元 的 地 址 在 运行 时 栈 上 ， 那 么 用 栈 间接 变 址 寻 址 访问 数组 元 素 ， 访 问 结 点 的 字段 也 
用 同样 的 方法 。 把 字段 偏 移 量 而 不 是 索引 值 放 和 人 变 址 寄存 器 中 。 编 译 器 将 

first->data = value; 
翻译 为 

0027 C30000 LDWA value,s ;first->data = value 


002A C80000 LDWX data,i 
002D E70004 STWA first,sfx 


类 似 地 ， 编 译 器 将 
First->next = p; 


翻译 为 


0030 C30002 LDWA p,s ;first->next = p 
0033 C80002 LDWX next,i 
0036 E70004 STWA first,sfx 
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来 看 一 看 指向 结 点 的 局 部 指针 怎样 使 用 栈 间 接 变 址 寻 址 ， 记 住 CPU 这 样 计算 操作 数 

Oprnd = Mem[Mem[SP + OprndSpec] + X] 

它 将 栈 指针 和 操作 数 指示 符 相 加 ， 把 这 个 和 作为 第 一 个 字段 的 地 址 ， 再 把 它 加 到 变 址 
寄存 器 上 。 用 栈 间接 变 址 寻 址 执行 了 0036 处 的 STWA 之 后 ,其 计算 状态 如 图 6-49b 所 示 。 
调用 malloc() 已 经 返回 最 新 分 配 的 结 点 地 址 007E， 把 它 存储 在 first 中 。 这 时 0030 处 的 
LDWA 指令 已 经 把 p 的 值 007A 放 和 人 累加 器 。0033 处 的 LDWX 指令 也 已 把 next 值 ， 即 偏 移 
E 2 放 入 变 址 寄存 器 。0036 处 的 用 栈 间 接 变 址 寻 址 执行 的 STWA 指令 ， 操 作 数 指示 符 是 4, 
即 first 值 。 操 作 数 的 计算 为 

Mem[Mem[SP + OprndSpec] + X] 

Mem[Mem[FB89 + 4] + 2] 

Mem[Mem[FB8D] + 2] 

Mem[Mem[007E+ 2] 

Mem[0080] 

这 是 first 指向 的 结 点 的 next 字段 。 

总 之 ， 为 了 访问 局 部 指针 指向 的 结 点 的 字段 ， 编 译 器 遵循 如 下 规则 生成 代码 : 

e 用 .EQUATE 使 得 结 点 的 字段 名 等 于 字段 距离 结 点 第 一 个 字 节 的 偏 移 量 。 

o 用 立即 数 寻 址 的 SUBSP tot 给 结构 分 配 存储 空间 ， 其 中 tot 是 结构 占用 的 总 字 节 数 。 

o 访问 p 指向 的 字段 时 ， 生 成 用 栈 相对 寻 址 的 LDWX 把 p 的 值 装 入 变 址 寄存 器 ， 后 面 

跟 一 条 根据 栈 间接 变 址 寻 址 单元 中 的 类 型 生成 的 LDWA 或 LDBA。 

你 应 该 能 够 确定 编译 器 是 怎样 翻译 全 局 指针 指向 的 结 点 的 程序 了 吧 。 本 章 末 尾 有 一 个 给 
学 生 的 练习 就 是 归纳 总 结 这 个 翻译 规则 ， 还 有 一 道 习 题 是 翻译 具有 指向 结 点 的 全 局 指针 的 C 
程序 。 


本 章 小 结 


编译 器 用 机 器 层 的 条 件 分 支 指令 翻译 高 级 语言 层 的 让 语句 和 循环 。iVelse 语句 需要 一 个 
条 件 分 支 指令 测试 让 条 件 ，else 部 分 需要 一 个 无 条 件 分 支 指令 。while 或 do 循环 的 翻译 需要 
一 个 跳 转 到 前 面 指令 的 分 支 。 除 此 之 外 ，for 循环 还 需要 指令 初始 化 和 递增 控制 变量 。 

Bohm 和 Jacopini 证 明 的 结构 化 编程 定律 认为 任何 包含 goto 的 算法 ， 不管 多 么 复杂 和 无 
结构 ， 都 可 以 用 镶 套 这 语 句 和 while 循环 来 编写 。Dijkstra 那 封 著名 的 信 中 指明 没有 goto 的 
程序 不 仅 可 行 而 且 更 好 ， 并 由 此 引发 了 针对 goto 的 争论 。 

编译 器 在 主 存 的 固定 位 置 分 配 全 局 变量 ， 过 程 和 函数 在 运行 时 栈 上 分 配 参 数 和 局 部 变 
量 。 通 过 增 大 栈 指针 (SP)， 值 被 压 人 栈 中 ; 通过 减 小 SP， 值 弹出 栈 。 子 例 程 调 用 指令 把 程 
序 计数 器 (PC) 的 内 容 ， 充 当 返 回 地 址 ， 压 入 栈 中 。 子 例 程 返 回 指 令 把 返回 地 址 从 栈 弹出 到 
PC。 指 令 用 直接 寻 址 方式 访问 全 局 值 ， 用 栈 相 对 寻 址 来 访问 运行 时 栈 上 的 值 。 传 引用 调用 
的 参数 会 把 它 的 地 址 压 人 运行 时 栈 中 ， 然 后 用 栈 相 对 间接 寻 址 来 访问 这 样 的 参数 。 布 尔 变量 
的 false ( 假 ) 存储 为 值 0，true (AL) 存储 为 值 1。 

数组 值 存 储 在 连续 的 主 存单 元 中 。 用 变 址 寻 址 访问 全 局 数组 的 元 素 ， 用 栈 变 址 寻 址 来 访 
问 局 部 数组 的 元 素 。 两 种 情况 下 ， 变 址 寄存 器 都 包含 数组 元 素 的 索引 值 ， 必 须 乘 以 每 个 单元 
所 占 字 节 数 。 作 为 参数 传递 的 数组 总 是 把 数组 第 一 个 单元 的 地 址 压 人 运行 时 栈 。 用 栈 间 接 变 
址 寻 址 来 访问 这 个 数组 的 元 素 。 编 译 器 用 一 个 地 址 数组 来 翻译 switch 语句 ， 该 数组 的 元 素 
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是 每 个 case 第 一 条 语句 的 地 址 。 地 址 数组 被 称 为 转移 表 。 

指针 和 struct 类 型 是 数据 结构 的 常用 构件 。 指 针 是 堆 上 一 个 内 存单 元 的 地 址 。 函 数 
malloc() 在 堆 上 分 配 内 存 。 用 间接 寻 址 来 访问 全 局 指针 指向 的 单元 ， 用 栈 相 对 间接 寻 址 来 访 
问 局 部 指针 指向 的 单元 。struct 有 多 个 命名 的 字段 ,存储 为 一 个 连续 的 字 节 组 。 用 变 址 寻 址 
来 访问 全 局 struct 的 字段 ， 变 址 寄存 器 包含 字段 距离 struct 第 一 个 字 节 的 偏 移 量 。 链 式 数据 
结构 通常 有 一 个 指向 struct 的 指针 ， 这 个 struct 称 为 结 点 ， 这 个 结 点 又 含有 指向 另 一 个 结 点 
的 指针 。 如 果 局 部 指针 指向 一 个 结 点 ,那么 使 用 栈 间接 变 址 寻 址 来 访问 该 结 点 的 字段 。 


练习 


6.1 节 

1. 请 解释 全 局 变量 和 局 部 变量 C 内 存 模型 的 不 同 点 。 它 们 是 怎样 分 配 和 访问 的 ? 

6.2 节 

2. 什么 是 优化 编译 器 ?什么 时 候 使 用 ? 什么 时 候 不 使 用 ? 请 解释 。 

*3, 图 6-14 中 目标 代码 在 000C 处 的 CPWA 测试 j 的 值 。 由 于 程序 从 循环 底部 分 支 到 那 条 指令 ， 为 什么 
编译 器 此 时 不 在 CPWA 之 前 生成 一 条 LDWAj，d 语句 ? 

4. 研究 图 6-16 神秘 程序 的 函数 ， 用 一 名 简短 的 话说 明 它 是 做 什么 的 ? 

5. 阅读 本 章 所 引用 的 Bohm, Jacopini 以 及 Dijkstra 的 论文 ， 据 此 写 一 篇 综述 文章 。 

6.3% 

*6. 像 图 6-19 那样 画 出 图 6-18 中 001C 处 的 第 二 条 CALL 语句 之 前 和 之 后 的 值 。 

7. 图 6-26 是 第 二 次 返回 后 的 运行 时 栈 。 仿 照 该 图 ， 绘 制 第 二 次 返回 前 的 运行 时 栈 。 

6.4 节 

*8. 在 图 6.40 的 Pep/9 程序 中 ， 如 果 给 Guess 输入 4， 在 0010 的 分 支 之 后 执行 什么 语句 ?为 什么 ? 

9. 6.4 节 没 有 展示 怎样 访问 二 维 数组 的 元 素 。 描 述 可 以 怎样 存储 二 维 数组 ， 以 及 从 这 样 的 二 维 数组 访 
问 元 素 所 需 的 汇编 语言 目标 代码 。 

6.5 节 

10. 访问 全 局 指针 指向 结 点 的 字段 的 翻译 规则 是 什么 ? 


编程 题 


6.2 节 
11. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 : 


#include <stdio.h> 


int main() { 

int number; 

scanf ("%d", &number) ; 

if (number % 2 == 0) { 
printf ("Even\n") ; 

} 

else { 
printf ("Odd\n") ; 

} 

return 0; 


} 
12. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 : 


Le 
oo 
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#include <stdio.h> 
const int limit = 5; 


int main() { 
int number; 
scanf ("%d", &mumber) ; 
while (number < limit) { 
number++; 
printf ("$d ", number); 
} 
return 0; 


} 
13. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 : 
#include <stdio.h> 


int main() { 

char ch; 

scanf("%c", &ch); 

if ((ch >= 'A') && (ch <= '2Z')) { 
printf ("A") ; 

} 

else if ((ch >= 'a') && (ch <= 'z')) { 
printii(ta") ; 

} 

else { 
printf ("Ss"); 

} 

printf ("\n") ; 

return 0; 


} 
14. 将 图 6-12 的 C 程序 翻译 为 Pep/9 汇编 语言 ， 但 是 把 do 循环 的 测试 条 件 改 为 


while (cop <= driver); 


15. 将 下 列 C 程序 转换 为 Pep/9 汇编 语言 : 


#include <stdio.h> 


int main() { 

int numItms, j, data, sum; 

scanf("%d", &numItms) ; 

sum = 0; 

for (j = 1; j <= numitms; j++) { 
scanf ("%d", &data) ; 
sum += data; 

} 

printf ("Sum: %d\n", sum); 

return 0; 


} 


示例 输入 
48-376 


示例 输出 
Sum: 18 


BOF BEIRA 


6.3 
16. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 : 


#include <stdio.h> 
int myAge; 


void putNext (int age) { 
int nextYr; 
nextYr = age + 1; 
printf ("Age: %d\n", age); 
printf ("Age next year: %d\n", nextYr) ; 


} 


int main () { 
scanf ("%d", &myAge) ; 
putNext (myAge) ; 
putNext (64) ; 
return 0; 


17. 将 上 面 习题 16 中 的 C 程序 翻译 成 Pep/9 汇编 语言 ， 但 是 把 myAge 声明 成 main() 中 的 局 部 变量 。 
18. 将 下 列 C 程序 转换 为 Pep/9 汇编 语言 。 它 用 递归 位 移 相 加 (recursive shift-and-add) 算法 进行 两 个 


整数 的 乘法 。mpr IERRA, meand 代表 被 乘 数 。 
#include <stdio.h> 


int times(int mpr, int meand) { 


if (mpr == 0) { 
return 0; 
} 
else if (mpr % 2 == 1) { 


return times(mpr / 2, mcand * 2) + mcand; 
else { 
return times(mpr / 2, mcand * 2); 
} 
} 


int main() { 
int n, m; 
scanf("$d $d", &n, &m); 
printf ("Product: d\n", times(n, m)); 
return 0; 


} 
19. 写 一 个 把 大 写字 母 转换 成 小 写字 母 的 C 程序 。 转 换 函 数 声明 为 


char toLower(char ch); 


如 果 ch 不 是 大 写字 母 ， 函 数 返 回 ch 不 变 。 如 果 它 是 大 写字 母 ， 则 将 “a” G5 “A” 的 差 与 ch 相 
加 ， 返 回 和 数 。( a) 编写 一 个 以 全 局 变量 为 实 参 的 程序 ， 并 将 你 的 C 程序 翻译 为 Pep/9 汇编 语言 。 
(b) 编写 一 个 以 局 部 变量 为 实 参 的 程序 ， 并 将 你 的 C 程序 翻译 为 Pep/9 汇编 语言 。 


20. 写 一 个 C 程序 ， 定 义 


int minimum(int jl, int j2) 


返回 jl 和 j2 中 较 小 的 那个 。(a) 编写 一 个 以 全 局 变量 为 实 参 的 程序 ， 并 将 你 的 C 程序 翻译 为 Pep/9 
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汇编 语言 。(b) 编写 一 个 以 局 部 变量 为 实 参 的 程序 ， 并 将 你 的 C 程序 翻译 为 Pep/9 汇编 语言 。 
21. 把 习题 2.13 中 用 递归 函数 计算 斐 波 那 契 数 列 的 C 方案 翻译 成 Pep/9 汇编 语言 。 
22. 把 习题 2.14 中 输出 汉 诺 塔 游戏 指令 的 C 方案 翻译 成 Pep/9 汇编 语言 。 
23. 图 6-25 的 递归 二 项 式 系数 函数 可 以 通过 像 下 面 那样 忽略 yl 和 y2 进行 简化 : 


int binCoeff(int n, int k) { 


if ((k == 0) || (n == k)) { 
return 1; 

} 

else { 


return binCoeff(n = 1, k) + binCoeff(nm = 1, k = 1); 
} 
} 
写 一 个 Pep/9 汇编 语言 程序 ， 调 用 这 个 函数 。 把 从 binCoeff(n-1,k) 返回 的 值 保存 在 栈 上 ， 在 这 个 
值 上 面 给 binCoeff(n-1, k-1) 调用 分 配 实 参 。 图 6-50 展示 了 运行 时 栈 的 跟踪 记录 ， 这 里 的 栈 帧 包 
含 4 个 字 (retVal、n、k 和 retAddrm)， 阴 影 表 示 的 字 是 函数 调用 的 返回 值 ， 它 展示 从 主 程序 中 调用 
binCoeff(3,1) 的 跟踪 记录 。 


TI Z 7 ie 7 7 Z d z boom 


(a) (b) (c) (d) (e) (f) (g) (h) (i) G) (k) 
图 6-50 图 6-25 的 运行 时 栈 跟踪 记录 
24. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 ， 它 用 递归 位 移 相 加 算法 进行 两 个 整数 的 乘法 - 


#include <stdio.h> 
int product, n, m; 
383 void times(int *prod, int mpr, int mcand) { 


*prod = 0; 
while (mpr != 0) { 
if (mpr % 2 == 1) { 
*prod = *prod + mcand; 


} 
mpr /= 2; 
mcand *= 2; 
} 
} 
int main () { 


scanf ("td td", &n, &m); 

times (&product, n, m); 

printf ("Product: %d\n", product) ; 
return 0; 


HOF 编 课 到 江 编 层 255 


25. 将 习题 24 中 的 C 程序 翻译 为 Pep/9 汇编 语言 ， 但 是 把 product、n 和 im 声明 为 main) 的 局 部 变量 。 
26.(a) 重 写 图 2-22 中 计算 递归 阶乘 的 C 程 序 ， 但 是 使 用 习题 24 中 的 times() 过 程 来 进行 乘法 运算 。 
在 fact( 中 用 一 个 额外 的 局 部 变量 来 存储 乘积 。 
(b) 将 你 写 的 C 程序 翻译 成 Pep/9 汇编 语言 。 
6.4 节 
27. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 : 
#include <stdio.h> 


int list [16]; 
int j, numItems; 
int temp; 


int main() { 

scanf ("%d", &numItems) ; 

for (j = 0; j < numItems; j++) { 
scanf("%d", &list[j]); 

} 

temp = list{[0]; 

for (j = 0; j < numItems - 1; j++) { 
list[j] = list[j + 1]; 

} 

list [numItems - 1] = temp; 

for (j = 0; j < numItems; j++) { 
printf£("td ", list[j]); 

} 

printf ("\n") ; 

return 0; 


} 


示例 输入 
5 
11 22 33 44 55 


示例 输出 

22 33 44 55 11 

因为 < 运算 符 右边 的 算术 表达 式 ， 第 二 个 for 循环 的 测试 很 难 翻 译 。 可 以 通过 把 这 个 测试 转换 成 下 
面 数学 上 等 价 的 测试 来 简化 翻译 : 





j + 1 < numItems:; 


28. 把 习题 27 中 的 C 程序 翻译 为 Pep/9 汇编 语言 ， 但 是 要 把 list, j, numItems 和 temp 声明 成 main() 
中 的 局 部 变量 。 
29. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 : 


#include <stdio.h> 


void getList (int ls[], int *n) { 
int j; 
scanf ("%d", n); 
for (j = 0; j < *n; j++) { 
scanf ("%d", &ls[j]); 


} 


256 BORD LHR (RSH) 


void putList(int ls[], int n) { 
int ji 
for (j = 0; j < n; j++) { 
print£ ("td "; Is(51); 
} 
Bein tN 


} 


void rotate(int ls[], int n) { 
IE: Jy 
int temp; 
temp = ls[0]; 
for (j = 0; j <n = 1; j++) { 
ls[j] = ls[j + 1]; 
} 
ls[n - 1] = temp; 


} 


int main() { 
int list [16]; 
int numItems; 
getList (list, &mumItems) ; 
putList (list, numItems) ; 
rotate(list, numItems) ; 
putList (list, numItems) ; 


return 0; 
} 
示例 输入 
5 
11 22 33 44 55 
示例 输出 


11 22 33 44 55 
22 33 44 55 11 


30. 将 习题 29 中 的 C 程序 翻译 为 Pep/9 汇编 语言 ， 但 是 把 list 和 numItems 声明 为 全 局 变量 。 
31. 将 图 2-25 中 用 递归 函数 把 一 个 数组 中 4 个 值 相 加 的 C 程序 翻译 为 Pep/9 汇编 语言 。 
32. 将 图 2-32 用 递归 过 程 反 转 局 部 数组 元 素 的 C 程序 翻译 为 Pep/9 汇编 语言 。 用 5 对 装 入 字 节 指令 和 存 
储 字 节 指 令 把 word 初始 化 为 “star”( 包 括 0 标记 符号 )， 用 栈 相 对 寻 址 的 STRO 翻译 printf() 语句 。 
33. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 : 


#include <stdio.h> 


int main () { 

int guess; 

printf ("Pick a number 0..3: "); 

scanf ("$d", &quess) ; 

switch (guess) { 
case 0: case 1: printf ("Too low"); break; 
case 2: printf("Right on"); break; 
case 3: printf("Too high") ; 

} 

printf ("\n"); 

return 0; 
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这 个 程序 除了 两 种 情况 执行 相同 的 代码 外 ， 和 图 6-40 的 程序 是 一 样 的 。 转 移 表 必须 正好 有 4 个 条 
目 ， 但 是 程序 必须 只 有 3 个 情况 符号 和 3 种 情况 。 
34. 将 下 列 C 程序 翻译 为 Pep/9 汇编 语言 : 


#include <stdio.h> 


int main () { 
int guess; 
printf ("Pick a number 0..3: "); 
scanf ("%d", &guess) ; 
switch (guess) { 
case 0: printf ("Not close"); break; 
case 1: printf("Too low"); break; 
case 2: printf("Right on"); break; 
case 3: printf("Too high"); break; 
default: printf£("Illegal input"); 
} 
printf ("\n"); 
return 0; 


} 


6.5 节 
35. 将 图 6-46 访问 结构 字段 的 C 程序 翻译 为 Pep/9 汇编 语言 ， 但 是 把 bill 声明 为 main) 的 局 部 变量 。 
36. 将 图 6-48 的 对 链表 进行 操作 的 C 程序 翻译 为 Pep/9 汇编 语言 ， 但 是 把 first, p 和 value 声明 为 全 局 
变量 。 
37. 在 图 6-48 中 main() 的 return 语句 前 插入 下 面 的 C 代码 片段 : 
sum = 0; p = first; 
while (p != 0) { 
sum += p->data; 


p = p->next; 


} 

printf ("Sum: %d\n", sum); 

将 整个 程序 翻译 为 Pep/9 汇编 语言 。 把 sum 和 其 他 局 部 变量 一 样 声明 如 下 : 
struct node *first, *p; 


int value, sum; 


. 将 下 面 的 代码 片段 插入 到 图 6-48 中 node 的 声明 和 maing 之 间 : 


void reverse(struct node *list) { 
if (list t= 0) { 
reverse (list->next) ; 
print£("%d ", list->data) ; 


3 


Co 


} 

把 下 面 的 代码 片段 插入 到 main() 中 return 语句 的 前 面 : 

print£("\n") ; 

reverse (first) ; 

peinesl (yn): 

将 整个 程序 翻译 为 Pep/9 汇编 语言 。 增 加 的 代码 以 逆序 输出 链表 。 
39. 在 图 6-48 中 main() 的 return 语句 前 插 人 下 面 的 代码 片段 : 


first2 = 0F p2 = 0; 


40. 


4 
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for (p = first; p IE 0; p = p->snext) { 
p2 = first2; 
first2 = (struct node *) malloc(sizeof (struct node)) ; 
first2->data = p->data; 
first2->next = p2; 
} 
for (p2 = first2; p2 != 0; p2 = p2->next) { 
printf ("td ", p2->data) ; 
} 
printf ("\n") ; 
把 first2 和 p2 与 其 他 局 部 变量 一 样 声明 为 : 
struct node *first, *p, *first2, *p2; 
int value; 


将 整个 程序 翻译 为 Pep/9 CRA. SHIA RS AE RS — TSE ZS, DAE RR HESISIP RTE 
将 习题 2.18 的 C 程序 翻译 为 Pep/9 汇编 语言 。C 程序 把 一 个 无 序 整数 列 输入 到 一 个 二 又 搜索 树 ， 
该 数列 用 -9999 作为 标记 符号 ， 用 中 序 遍 历 输出 它们 。 


.这 道 题 目 是 一 个 项 目 ， 用 C 写 出 Pep/9 计算 机 的 模拟 器 。 


(a) 写 出 一 个 装载 器 ， 以 标准 格式 的 Pep/9 目标 文件 作为 输入 ， 把 它 加 载 到 模拟 的 Pep/9 计算 机 的 
主 存 中 。 把 主 存 声明 为 一 个 整数 数组 ， 如 下 所 示 : 


int Mem[65536]; // Pep/9 main memory 


把 从 标准 输入 来 的 一 个 字符 串 作 为 输入 。 写 出 一 个 内 存 转 储 (memory dump) 函数 ， 以 代表 该 
程序 的 十 进 制 整数 序列 的 形式 输出 主 存 的 内 容 。 例 如 ， 输 入 如 图 4-42 所 示 : 


D1 00 OD F1 FC 16 D1 00 OE Fl FC 16 00 48 69 zz 


那么 程序 应 该 把 十 六 进 制 数 转换 为 整数 ， 把 它们 存储 在 Mem 的 前 1S 个 单元 中 。 输 出 就 应 该 是 
如 下 的 对 应 整数 值 : 


209 0 13 241 252 22 209 0 14 241 252 22 0 72 105 


(b) 实现 指令 LDBr、STBr 和 STOP， 寻 址 方式 为 立即 数 和 直接 寻 址 。 使 用 图 4-32 帮助 你 实现 
+ 诺 依 曼 执 行 周期 。 如 果 指 令 存 储 一 个 字 节 到 Mem[FC16]， 就 把 相应 的 字符 输出 到 标准 输 
出 流 。 如 果 指 令 从 Mem[FC15] 装 和 一 个 字 节 ， 就 从 标准 输入 流 输 入 相应 的 字符 。 例 如 ， 问 题 
(a) 中 的 输入 对 应 的 输出 应 该 是 Hi。 

(c) 以 原生 指令 的 方式 来 实现 DECO。 也 就 是 说 ， 不 要 实现 8.2 节 描 述 的 陷阱 机 制 。 

(d) 实现 指令 BR、LDWr、STWr、SUBSP 和 ADDSP， 寻 址 方式 为 栈 相 对 寻 址 。 用 Pep /8 汇 
编 器 汇编 图 6-1 的 程序 ， 然 后 把 十 六 进 制程 序 输 入 你 的 模拟 器 以 测试 你 的 实现 。 输 出 应 为 
BMW335i, 

(e) 实现 指令 ADDr、SUBr、ASLr 和 ASRr。 以 原生 指令 方式 实现 指令 DECI ASTRO. 输入 来 自 
C 的 标准 输入 流 ， 输 出 到 C 的 标准 输出 流 。 执 行 图 6-4 的 程序 来 测试 你 的 实现 。 

(f) 实现 条 件 分 支 指令 BRLE, BRLT, BREQ, BRNE, BRGE, BRGT 和 BRV、 一 元 指令 NOTr 
和 NEGr， 以 及 比较 指令 CPWr 和 CPBr。 执 行 图 6-6、 图 6-8， 图 6-10、 图 6-12 和 图 6-14 WE 
序 来 检验 你 的 实现 。 

(g) 实现 指令 CALL 和 RET。 执 行 图 6-18、 图 6-21、 图 6-23 和 图 6-25 的 程序 来 检验 你 的 实现 。 

(h) 实现 指令 MOVSPA ， 寻 址 方式 为 栈 相 对 间接 。 执 行 图 6-27 和 6-29 的 程序 来 检验 你 的 实现 。 

(i) 实现 变 址 、 栈 变 址 和 栈 间 接 变 址 寻 址 方式 。 执 行 图 6-34、 图 6-36、 图 6-38 、 图 6-40 和 图 6-48 
的 程序 来 检验 你 的 实现 。 

G) 实现 间接 寻 址 方式 。 执 行 图 6-42 的 程序 来 检验 你 的 实现 。 
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现在 ， 你 也 是 使 用 多 语种 的 人 了 ， 因 为 你 至 少 懂得 4 种 语言 了 : 汉语 、C、Pep/9 汇编 
语言 和 机 器 语言 。 汉 语 是 自然 语言 ， 而 其 他 3 种 是 人 工 语言 。 

要 记 住 这 一 点 。 下 面 让 我 们 先 转 到 计算 机 科学 的 基本 问题 ， 即 “什么 能 够 被 自动 化 ?” 
我 们 用 计算 机 来 自动 化 所 有 的 事情 ， 从 写 工 资 支票 到 纠正 文稿 中 的 拼写 错误 。 尽 管 计算 机 科 
学 在 自然 语言 翻译 上 还 不 算 很 成 功 ， 比 如 从 德语 翻译 到 英语 ， 但 在 翻译 人 工 语言 方面 ， 它 已 
经 非常 成 功 了 。 我 们 已 经 学 习 了 如 何 对 3 种 人 工 语言 C、Pep/9 汇编 语言 和 机 器 语言 互相 转 
换 进行 翻译 。 编 译 器 和 汇编 器 自动 化 了 这 些 人 工 语言 之 间 的 翻译 过 程 。 

因为 计算 机 系统 的 每 一 层 都 有 自己 的 人 工 语言 ， 所 以 这 些 语言 之 间 的 自动 翻译 是 计算 机 
科学 的 核心 。 计 算 机 科学 家 已 经 提出 了 非常 丰富 的 人 工 语言 及 其 自动 翻译 过 程 的 理论 ， 本 章 
的 内 容 就 是 介绍 这 一 理论 ， 并 展示 它 怎样 应 运 于 从 C 到 Pep/9 汇编 语言 的 翻译 。 

句法 和 语义 是 人 工 语言 的 两 个 属性 。 计 算 机 语言 的 句法 (syntax) 是 一 个 程序 要 成 为 合 
法 的 语言 程序 必须 要 遵守 的 一 套 规则 。 语 义 ( semantic) 是 合法 程序 背后 的 含义 或 逻辑 。 在 
操作 上 ， 翻 译 器 程序 可 以 成 功 地 翻译 句法 正确 的 程序 。 语 言 的 语义 决定 目标 程序 执行 时 ， 翻 
译 后 程序 产生 的 结果 。 

自动 翻译 器 中 比较 源 程 序 和 语言 句法 的 部 分 叫 作 分 析 器 (parser). 给 源 程序 指定 含义 的 
部 分 叫 作 代码 生成 器 (code generator)。 大 多 数 计算 机 科学 理论 应 用 于 翻译 过 程 的 句法 部 分 
而 不 是 语义 部 分 。 

这 里 是 描述 语言 句法 的 3 种 常用 技术 : 

e 语法 

e 有 限 状态 机 

e 正则 表达 式 

本 章 介绍 语法 和 有 限 状 态 机 ， 展 示 怎 样 构建 软件 有 限 状态 机 来 帮助 进行 分 析 。 最 后 一 节 
讲述 了 一 个 完整 的 程序 ， 包 括 代 码 生成 ， 它 实现 了 两 种 语言 之 间 的 自动 翻译 。 由 于 篇 幅 限 
制 ， 本 章 没有 对 正则 表达 式 进 行 讲 解 。 


7.1 语言 、 语 法 和 语法 分 析 


每 种 语言 都 有 它 的 字符 表 。 从 形式 上 来 说 ， 每 个 字符 表 都 是 一 组 有 限 、 非 空 的 字符 。 例 
如 ，C 的 字符 表 是 非 空 集合 


和 有 
Of BB 
EREKE GHRahKE kh M NG B 
0 7 esm Bh eA R 
d S EA B OF wm S&S BB J ey “Sn Bs [, 
Ae te Os fe omy at te te HO Me OS 
» \ # 7% % |, = 
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Pep/9 汇编 语言 的 字符 表 除 了 标点 符号 之 外 其 他 是 一 样 的 ， 如 下 所 示 : 


和 
DB GES & UUW BE MBA B 
GOpREaEanB GG Hiiwk kt M NM oOo P 
BEEBE BH BE BG DB 3 
4, 5, 6 7 8 9 \ ty b 


另 一 个 字符 表 的 例子 是 实数 语言 的 字符 表 ， 不 是 科学 记 数 法 表示 的 实数 。 它 的 字符 表 集 


7.1.1 连接 


抽象 数据 类 型 是 一 个 可 能 值 的 集合 和 一 组 作用 于 这 些 值 的 运算 。 注 意 ， 字 符 表 就 是 值 的 
集合 。 值 的 集合 上 的 一 种 运算 叫 连接 ( concatenation)， 它 简单 地 连接 两 个 或 者 更 多 的 字符 成 
为 字符 串 。C 字符 表 中 的 一 个 例子 是 把 ! 和 = 连接 成 为 字符 串 !=。 在 Pep/9 汇编 字符 表 中 ， 
可 以 把 0 和 x 连接 成 为 0x， 即 十 六 进 制 常数 前 级 。 在 实数 语言 中 ， 可 以 把 -、2、3、. 和 7 
连接 成 为 -23.7。 

连接 不 仅 适用 于 字符 表 中 单个 字符 构成 字符 串 ， 也 适用 于 用 字符 串 构 成 更 大 的 字符 串 。 
从 C 字符 表 ， 可 以 连接 void、printBar 和 (int n) 来 生成 过 程 头 

void printBar (int n) 

字符 串 的 长 度 是 字符 串 中 字符 的 个 数 。 字 符 串 void 的 长 度 是 4。 长 度 为 0 的 字符 串 叫 空 
字符 串 ， 用 希腊 字母 s 表示 ， 区 别 于 字母 表 中 的 英语 字符 。 它 有 这 样 的 连接 性 质 

EX=XE=X 
这 里 x 是 一 个 字符 串 。 空 字符 串 对 描述 句法 规则 非常 有 用 。 

在 数学 术语 中 ，s 是 连接 运算 的 单位 元 。 一 般 来 说 ， 一 个 运算 的 单位 元 (identity 
element) i， 在 作用 于 一 个 值 x 时， 不 会 改变 x 的 值 。 

GHD 1 是 乘法 运算 的 单位 元 ， 因 为 

l * x=x * l=x 
true 是 AND 运算 的 单位 元 ， 因 为 
true AND g=q AND true=q a 


7.1.2 BE 


如 果 工 是 一 个 字符 表 , TMM MRR T*, CEER TP ioc H ETE a A 
字符 串 的 集合 。T* 是 非常 大 的 。 例 如 ， 如 果 工 是 英语 字符 表 中 字符 和 标点 符号 的 集合 ， 那 
么 T* 会 包括 所 有 莎士比亚 著作 、 英 文 圣经 和 所 有 曾经 出 版 的 英文 百科 全 书 的 句子 ， 还 包括 
全 世界 历史 上 所 有 图 书馆 曾经 用 这 些 字符 印刷 的 所 有 字符 串 。 

它 不 仅 包 括 有 意义 的 字符 串 ， 也 包括 无 意义 的 字符 串 。 这 里 是 英语 字符 表 T* 的 一 些 
元 素 : 

To be or not to be, that is the question. 

Go fly a kite. 


Here over highly toward? 
alkeu jfoj ,9nm20mfq23jk 1?x!jeo 
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当 了 是 实数 语言 的 字符 表 时 ，T* 的 一 些 元 素 可 以 是 : 


-2894.01 


你 可 以 很 容易 地 构建 刚才 提 到 的 两 个 字符 表 的 T* 的 很 多 其 他 元 素 。 因 为 字符 串 可 以 无 
限 长 ， 所 以 任何 字符 表 的 闭 包 中 元 素 个 数 是 无 限 的 。 

什么 是 语言 呢 ? 在 前 面 讲 述 的 T* 例子 中 ,一 些 字符 串 是 语言 ， 一 些 不 是 。 在 英语 的 例 
子 中 ， 前 两 个 字符 串 是 有 效 的 英语 句子 ， 即 它们 是 语言 。 后 两 个 不 是 语言 。 语 言 (language) 
是 它 字 符 表 闭 包 的 子 集 。 可 以 用 字符 表 中 的 字符 组 成 的 字符 串通 过 连接 构建 无 限 多 的 字符 
串 ， 但 是 其 中 只 有 一 些 包含 在 语言 中 。 

思考 下 面 T* 中 的 两 个 元 素 ， 这 里 T 是 C 语言 字符 表 : 

#include <stdio.h> 

int main() { 

printf ("Valid") ; 


return 0; 


} 


#include <stdio.h> 

int main(); { 
printf ("Valid"); 
return 0; 


} 
T* 的 第 一 个 元 素 是 C 语言 ， 但 第 二 不 是 ， 因 为 它 有 一 个 句法 错误 。 m 
7.1.3 Wik 


要 定义 一 种 语言 ， 需 要 一 种 方式 能 够 说 明 T* 中 哪些 元 素 是 语言 ， 哪 些 不 是 。 语 法 
(grammar) 就 是 这 样 一 种 系统 ， 它 指明 可 以 怎样 连结 字符 表 T 的 字符 形成 一 种 对 该 语言 来 说 
合法 的 字符 串 。 形 式 上 ， 语 法 包含 4 个 部 分 : 

e N， 一 个 非 终结 字符 表 。 

。 T, 一 个 终结 字符 表 。 

e。 P, 一 套 产生 式 规则 。 

e。 S， 初 始 符 ， 为 N 的 一 个 元 素 。 

非 终结 字符 表 N 的 一 个 元 素 代表 终结 字符 表 T 的 一 组 字符 。 非 终结 符号 通常 用 尖 括 号 二 
括 起 来 。 当 阅读 语言 时 ， 看 到 的 是 终结 符 ， 看 不 到 非 终结 符号 。 产 生 式 规则 使 用 非 终结 符 来 
描述 语言 的 结构 ， 这 可 能 不 像 阅读 语言 那么 明显 。 

C 语 法 中 ， 非 终结 符 <compound-statement> (< 复合 语句 >) 可 能 代表 下 面 一 组 
终结 符 : 

{ 

IHE i; 
scanf ("%d", &i); 
printf ("sd", i); 


} 








396 








397 
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C 程序 的 代码 始终 是 包含 终结 符 而 绝 不 会 包含 非 终 结 符 。 我 们 肯定 不 会 看 到 这 样 的 C 
代码 

#include <stdio.h> 

main () 


<compound-statement> 


非 终结 符 <compound-statement > 用 于 描述 C 程序 的 结构 。 a 

每 种 语法 都 有 一 个 特殊 的 非 终 结 符 ， 叫 作 初 始 符 〈start symbol), So EE N 是 一 个 集合 ， 
但 $ 不 是 。S 是 集合 N 的 一 个 元 素 。 初 始 符 和 产生 式 规 则 P 一 起 ， 使 我 们 能 确定 一 个 由 终结 
符 组 成 的 字符 串 是 否 是 该 语言 的 一 个 合法 句子 。 如 果 从 S 开始 用 产生 式 规 则 能 产生 该 终结 符 
组 成 的 字符 串 ， 那 么 该 字符 串 就 是 一 个 合法 的 句子 。 


7.1.4 C 标识 符 的 语法 
N = { <identifier> , <letter> , <digit> } 


图 7-1 中 的 语法 定义 了 C 标识 符 。 尽 管 C 标识 符 [T= La.P 2.2.2.3) 


P = the productions 


可 以 使 用 任意 的 大 写 或 小 写字 母 或 者 数字 ， 但 是 为 了 1, <identifier> 一 <letter> 

使 例子 简短 ， 这 个 语法 仅 允许 字母 a、b、c 和 数字 1、 ne 
2、3。 这 样 的 简化 仍然 能 够 使 我 们 了 解构 成 标识 符 的 a aS — a 

规则 。 第 一 个 字符 必须 是 字母 ， 如 果 有 的 话 ， 剩 下 的 cue 

字符 可 以 是 字母 或 数字 的 任意 组 合 。 7. <digit> > 1 


这 个 语法 有 3 个 非 终结 符 ， 即 <identifier> (< 标识 digi 一 2 
符 >)、<letter> (< 字母 >) Al <digit> (< 数字 >)。 初 ea 
始 符 是 <identifier>， 它 是 非 终 结 符 集合 中 的 一 个 元 素 。 

产生 式 规则 的 形式 是 图 7-1 “C 标识 符 的 语法 

A—>w 

这 里 A 是 非 终 结 符 ，w 是 终结 符 和 非 终 结 组 成 的 字符 串 。 符 号 一 表示 “产生 ”。 图 7-1 
中 的 产生 式 规则 3 读 作 “标识 符 产 生 后 面 带 数字 的 标识 符 ”。 

语法 通过 称 为 推导 ( derivation) 的 过 程 来 指定 语言 。 为 了 推导 一 个 合法 的 语言 句子 ， 从 
初始 符 开始 ， 根 据 产生 式 规 则 不 断 蔡 代 非 终结 符 , 直到 得 到 由 终结 符 组 成 的 字符 串 。 下 面 是 
根据 语法 推导 出 标识 符 cab3 的 情况 ， 符 号 => 表示 “一 步 推 导 ”: 





<identi er> => <identier> <digit> 规则 3 
=> <identier> 3 规则 9 
=> <identier> <letter> 3 规则 2 
=> <identier> b 3 规则 5 
=> <identier> <letter> b 3 规则 2 
=> <identier> ab 3 规则 4 
=> <letter> a b 3 规则 1 
=>cab3 规则 6 


每 一 步 推导 的 后 面 是 这 个 替换 依据 的 产生 式 规则 。 例 如 ， 规 则 2 
<identifier> — <identifier><leiter> 
用 于 替换 推导 步骤 


<identifier> 3 =><identifier><letter> 3 
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中 的 <identifier>。 应 该 把 这 步 推导 读 作 “identifier 后 面 跟着 3 一 步 推导 为 identifier 后 面 跟 
着 字母 ， 字 母后 面 跟着 3”。 

推导 运算 的 闭 包 类 似 于 字符 表 的 闭 包 运算 ， 符 号 =>* 表示 “经 过 零 步 或 多 步 推导 “， 可 
以 把 前 面 8 步 推导 概括 为 : 

<identifier> =>*c a b 3 

这 个 推导 证 明 cab3 是 一 个 合法 的 标识 符 ， 因 为 它 能 够 从 初始 符 <identifier> 推导 出 来 。 
一 个 语法 定义 的 语言 是 由 使 用 产生 式 规则 可 以 从 初始 符 推 导出 的 所 有 字符 串 组 成 的 。 语 法 提 
供 了 判定 是 否 属 于 一 个 语言 的 测试 操作 ， 如 果 是 不 能 被 推导 出 来 的 字符 串 ， 那 么 就 不 属于 该 


语言 。 





7.1.5 有 符号 整数 的 语法 oleh ie 
图 7-2 中 的 语法 定义 了 有 符号 整数 的 语言 ，d 代表 一 个 十 进 
制 数字 。 初 始 符 工 代表 整数 ,F 是 第 一 个 字符 ， 可 以 是 任意 符号 ， AP 
M 表示 大 小 。 
有 时 候 为 了 节省 页 面 空 间 ， 产 生 式 规则 没有 编号 ， 放 在 一 5.M— 4M 
行 上 。 这 个 语法 的 产生 式 规则 可 以 写成 这 样 — 
I— FM 
ERTE 图 7-2 有 符号 整数 的 语法 
M 一 d|dM 


这 里 的 竖 线 | 是 间隔 运算 符 ， 读 作 “或 。 最 后 一 行 读 作 “M 产生 d, 或 者 d 后 面 跟 M . 
下 面 是 这 个 语法 的 一 些 合法 有 符号 整数 的 推导 : 


I= FM Is FM I > FM 
>FdM =>FdM =>FdM 
=> F dd M => F dd => F dd M 
= F ddd => dd => F ddd M 
= —ddd => Fdddd 
=> +dddd 


注意 第 二 个 推导 的 最 后 一 步 怎样 用 空 字符 串 从 Fdd 推导 出 dd， 它 使 用 了 产生 式 F 一 e 
和 s d=d 的 事实 。 这 种 带 空 字 符 串 的 产生 式 规 则 能 很 方便 地 表达 一 个 事实 : 数值 大 小 前 面 的 
正 号 或 负 号 是 可 选 的 。 

ddd+、+-ddd 和 ddd+dd 都 是 这 种 语法 的 非法 字符 串 。 试 着 用 语法 推导 这 些 字 符 串 来 确 
认 它 们 不 属于 该 语言 。 你 能 根据 产生 式 规 则 证 明 这 几 个 字符 串 不 属于 该 语言 吗 ? 

这 两 个 语法 示例 中 的 产生 式 都 有 递归 规则 ， 用 非 终结 符 来 定义 它 自 己 。 图 7-1 中 规则 3 
根据 <identifier> 定义 <identifier>， 如 下 所 示 : 

<identifier> 一 <identifier><digit> 
图 7-2 中 规则 5 根据 M 定义 M， 如 下 所 示 : 
M —> dM 

递归 规则 产生 的 语言 具有 无 穷 多 合法 的 句子 。 要 推导 出 一 个 具有 任意 长 度 的 标识 符 ， 只 
要 一 直 将 <identifier> 替换 成 <identifier><digit> 即 可 。 

与 所 有 的 递归 定义 一 样 ， 必 须 有 一 个 安全 出 口 作为 定义 的 基础 ， 和 否则 对 非 终结 符 的 替换 
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就 不 会 停 下 来 。 图 7-2 中 M 一 d 的 规则 给 M 的 递归 提供 了 基础 。 


7.1.6 上下文 相关 的 语法 

前 面 讲 到 的 语法 的 产生 式 规则 都 是 左边 是 单个 的 非 终 结 符 。 图 7-3 中 的 语法 有 一 些 左 边 
既 有 非 终 结 符 又 有 终结 符 的 产生 式 规则 。 

这 是 一 个 使 用 该 语法 的 终结 字符 串 推导 : 





A => aABC 规则 1 es og 
=> aaABCBC 规则 1 P = the productions 
=> aaabCBCBC 规则 2 De 
=> aaabBCCBC 规则 3 
=> aaabBCBCC 规则 3 
=> aaabBBCCC 规则 3 
= aaabbBCCC 规则 4 
=> aaabbbCCC 规则 4 图 7-3 ”上下文 相关 的 语法 
=> aaabbbcCC 规则 5 
= aaabbbccC 规则 6 
= aaabbbece 规则 6 


这 个 推导 中 一 个 替换 的 例子 是 在 步骤 aaabbbCCC => aaabbbeCC 使 用 了 规则 5， 规则 5 
允许 用 c 替换 C， 但 是 只 有 当 C 的 左边 有 的 时 候 才 行 。 

在 英语 中 ， 断 章 取 义 是 指 不 考虑 一 句 话 周围 的 语句 而 引用 它 。 规 则 5 就 是 一 个 上 下 文 相 
关 规 则 的 例子 ， 它 不 允许 用 c 替换 C， 除 非 C 有 适当 的 上 下 文 ， 即 它 正 好 在 一 个 b 的 右边 。 

不 严格 地 说 ， 上 下 文 相 关 语 法 ( context-sensitive grammar) 的 产生 式 规 则 左边 可 以 包含 
多 于 一 个 的 非 终结 符 。 与 之 相 比 ， 每 个 产生 式 规则 左边 只 有 一 个 非 终结 符 的 语法 ， 称 为 上 下 
文 无 关 (context-free) 语法 。( 上 下 文 相关 和 上 下 文 无 关 语法 的 准确 理论 定义 要 比 这 些 定义 更 
为 严格 。 为 简单 ， 本 章 使 用 前 面 的 这 种 定义 ,不 过 我 们 应 该 知道 该 理论 更 严格 的 描述 并 不 像 
我 们 定义 的 那样 简单 。) 

abc、aabbcc 和 aaaabbbbecce 是 这 种 语法 描述 语言 的 一 些 合 法 字符 串 的 例子 。 而 aabe 和 
cha 是 非法 字符 串 的 例子 。 可 以 试 着 推导 出 这 些 合法 字符 串 ， 也 可 以 尝试 推导 这 些 非法 字符 
串 以 证 明 它 们 是 不 合法 的 。 用 这 些 规则 做 一 些 练习 ， 你 应 该 能 了 解 这 种 语言 是 以 一 个 或 多 个 
a 开始， 后 面 跟 同 样 数量 的 b， 后面 再 跟 同样 数量 的 c 的 字符 串 集 合 。 这 种 语言 L 用 数学 语 
言 来 表达 为 

L={a"b"c" | n > 0} 
读 作 “语言 L 是 字符 串 a"b"c" 的 集合 , n 大 于 0”。 符 号 a" 表示 n 个 a 的 连接 。 


7.1.7 语法 分 析 问 题 


从 语法 推导 出 合法 字符 串 是 非常 简单 明了 的 。 可 以 在 当前 中 间 字 符 串 的 右边 任意 选择 一 
些 非 终 结 符 ， 反复 选择 规则 进行 替换 ， 直 到 得 到 一 个 终结 符 字符 串 。 这 样 的 随机 推导 可 以 得 
到 该 语言 的 许多 字符 串 。 

然而 ， 自 动 翻译 器 是 一 项 更 难 的 任务 。 给 翻译 器 一 个 终结 符 字符 串 ， 假 设 是 某 个 人 工 语 
言 的 合法 句子 。 在 翻译 器 生成 目标 代码 前 ， 它 必须 确定 终结 符 字符 串 是 否 确实 是 合法 的 。 确 
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定 字符 串 是 否 合法 的 唯一 办 法 是 从 语法 的 初始 符 推导 出 它 。 翻 译 器 必须 尝试 进行 这 样 的 推 
导 ， 如 果 推 导 成 功 了 就 知道 这 个 字符 串 是 一 个 合法 的 句子 。 确 定 一 个 给 定 的 终结 符 字符 串 是 
否 是 特定 语法 的 合法 句子 的 问题 叫 作 语法 分 析 (parsing)， 如 图 7-4 所 示 。 


a) 推导 合法 句子 
b) 语法 分 析 问 题 
图 7-4 推导 任意 句子 和 语法 分 析 给 定 句 子 的 区 别 


对 给 定 的 字符 串 进 行 语法 分 析 要 比 推导 任意 的 合法 字符 串 更 难 。 语 法 分 析 问 题 就 是 某 种 
形式 的 搜索 。 分 析 算 法 必须 搜索 出 正确 的 蔡 换 序列， 推导 出 给 定 的 字符 串 。 它 不 仅 要 在 给 定 
字符 串 是 合法 的 情况 下 找到 这 个 推导 ， 它 也 必须 能 够 发 现 给 定 字符 串 有 可 能 不 是 合法 的 。 如 
果 你 在 房间 里 寻找 一 枚 钻石 戒指 ， 但 是 找 不 到 ， 并 不 表示 戒指 不 在 你 的 房间 里 。 可 能 只 是 你 
没 找到 对 的 地 方 。 类 似 地 ， 如 果 试 图 找到 给 定 字符 串 的 推导 ， 但 是 找 不 到 ， 你 怎么 知道 推导 
不 存在 呢 7 翻译 器 必须 能 够 证 明 如 果 给 定 的 字符 串 是 非法 的 ， 一 定 不 存在 对 应 的 推导 。 


7.1.8 表达 式 的 语法 


为 了 了 解 语法 分 析 器 可 能 遇 到 的 困难 ， 考 虑 图 7-5， 它 给 出 了 描述 算术 中 缀 表达 式 的 语 
法 。 假 设 给 定 的 终结 符 字 符 串 为 

(a*a)ta 

给 定 该 语法 的 产生 式 规则 ， 要 求 对 给 定 的 字符 串 进行 分 析 。 正 确 的 语法 分 析 是 : 

E>E+T 规则 1 TET 
T+T 规则 2 T={+,*,(,),a} 
sF+T 规则 4 P = the productions 
=>(E)+T 规则 5 
=a (T) eT 规则 2 
STF TT 规则 3 
S( Pe FytT 规则 4 


=>(a*F)+T 规则 6 
>(a*a)+T 规则 6 图 7-5 表达 式 的 语法 。 非 终结 符 E 


=>(a*a)+F 规则 4 表示 表达 式 ,T 表 示 一 个 术语 ， 
=>(a * a ) +a 规则 6 F 表示 表达 式 中 一 个 因子 

语法 分 析 困 难 的 原因 是 可 能 在 前 面 的 分 析 中 就 做 出 了 错误 的 决定 ， 虽然 在 当时 看 上 去 是 

可 行 的 ,但 是 会 导致 进入 死路 。 例 如 ,看 见 给 定 的 字符 串 里 有 “(”"， 就 立即 选择 规则 5。 你 





可 能 会 尝试 这 样 进行 分 析 
EST 规则 2 
>F 规则 4 
=>(E) 规则 5 


=>(T) 规则 2 
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=>(T*F) 规则 3 
>(F*F) 规则 4 
>(a*F) 规则 6 Ë 


(a*a) 规则 6 ae 

到 目前 为 止 ， 看 上 去 是 在 朝 着 分 析 该 原始 表达 式 
的 目标 上 前 进 ， 因 为 随 着 推导 的 每 一 步 ， 中 间 字 符 | 
串 看 上 去 都 更 像 原始 的 字符 串 了 。 不 幸 的 是 ， 却 陷 | 
和 了 困境 ， 因 为 没有 办 法 推导 出 原始 字符 串 中 的 +。 F 

在 到 达 这 个 死胡同 之 后 ,我 们 可 能 会 得 出 结论 : | 
该 给 定 的 字符 串 是 非法 的 ， 但 是 这 是 错 的 。 因 为 找 gt 
不 到 一 个 推导 并 不 意味 着 这 样 的 推导 不 存在 。 


s —m—-4 


| 

语法 分 析 有 趣 的 一 面 是 它 可 以 表示 为 一 棵 树 。 初 T 
始 符 是 树 根 。 树 的 每 个 内 部 结 点 是 一 个 非 终结 符 ， a 
每 个 叶子 结 点 是 一 个 终结 符 。 内 部 结 点 的 孩子 是 在 | | 
推导 中 用 来 蔡 换 父亲 结 点 的 产生 式 规则 右边 部 分 的 a 


符号 。 这 种 树 称 为 语法 树 ， 原 因 显 而 易 见 。 图 7-6 
给 出 了 采用 图 7-5 所 示 语 法 的 (a*a)+a 的 语法 树 。 图 


图 7-6 图 7-5 中 (a*a)+ta 的 语法 分 析 树 
7-7 给 出 了 采用 图 7-2 中 语法 的 dd 的 语法 树 。 


7.1.9 C 语法 的 一 部 分 te 
图 7-8 中 语法 的 产生 式 规则 是 C 语言 的 一 小 部 A M 

分 。 这 种 语言 的 基本 数据 类 型 只 有 整数 和 字符 ， 不 | ~ 
提供 常量 或 类 型 声明 ， 不 允许 引用 参数 ， 还 省 略 了 | 
switch #il for 语句。 尽管 有 诸多 限制 ， 但 是 它 仍然 给 8 

出 了 如 何 形式 化 定义 一 个 真实 语言 语法 的 大 致 思路 。 图 7-7 图 7-2 中 dd 的 语法 分 析 树 



























<translation-unit> 一 
<external-declaration> 
| <translation-unit> <external-declaration> 
<external-declaration> 一 
<function-definition> 
| <declaration> 
<function-definition> > 
<type-specifier> <identifier> ( <parameter-list> ) <compound-statement> 
| <identifier> ( <parameter-list> ) <compound-statement> 
<declaration> 一 <type-specifier> <declarator-list> ; 
<type-specifier> 一 void | char | int 
<declarator-list> 一 
<identifier> 
| <declarator-list> , <identifier> 
<parameter-list> 一 
E 
| <parameter-declaration> 
| <parameter-list> , <parameter-declaration> 
<parameter-declaration> — <type-specifier> <identifier> 


图 7-8 C 语言 的 一 部 分 语法 


<compound-statement> — { <declaration-list> <statement-list> } 


<declaration-list> > 

£ 

| <declaration> 

| <declaration-list> <declaration> 
<statement-list> 一 

E 

| <statement> 

| <statement-list> <statement> 
<statement> > 

<compound-statement> 

| <expression-statement> 

| <selection-statement> 

| <iteration-statement> 
<expression-statement> — <expression> ; 
<selection-statement> 一 

if (<expression> ) <statement> 

| i£ ( <expression> ) <statement> else <statement> 
<iteration-statement> —> 

while ( <expression> ) <statement> 

| do <statement> while (<expression> ) ; 
<expression> 一 

<relational-expression> 

| <identifier> = <expression> 
<relational-expression> 一 

<additive-expression> 

| <relational-expression> < <additive-expression> 

| <relational-expression> > <additive-expression> 

| <relational-expression> <= <additive-expression> 

| <relational-expression> >= <additive-expression> 
<additive-expression> > 

<multiplicative-expression> 

| <additive-expression> + <multiplicative-expression> 

| <additive-expression> - <multiplicative-expression> 
<multiplicative-expression> 一 

<unary-expression> 

| <multiplicative-expression> * <unary-expression> 

| <multiplicative-expression> / <unary-expression> 
<unary-expression> 一 

<primary-expression> 

| <identifier> ( <argument-expression-list> ) 
<primary-expression> 一 

<identifier> 

| <constant> 

| ( <expression> ) 
<argument-expression-list> > 

<expression> 


| <argument-expression-list> , <expression> 
<constant> 一 


<integer-constant> 
| <character-constant> 
<integer-constant> 一 





图 7-8 (#8) 
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<digit> 

| <integer-constant> <digit> 
<character-constant> — ' <letter> ' 
<identifier> > 


<letter> 


| <identifier> <letter> 


| <identifier> <digit> 
<letter> 一 
alblclalelflglhliljlxlllml 
nalelplgqlzlsltlulvlwlxlylzl 
A|B|C|D[E|F|G|H|I[o|K|L|M| 
N/O|P|Q|R|S|T|U|V|w|x|y|z 
<digit> > 
0|1|2|3|14|5js|7|s|s 


图 7-8 ( 续 ) 


该 语法 的 非 终 结 符 用 尖 插 号 <> 括 起 来 。 任 何 没有 用 人 尖 插 号 括 起 来 的 符号 是 终结 字符 ， 
可 以 出 现在 C 程序 代码 中 。 该 语法 的 初始 符 是 非 终结 符 <translation-unit> (< 翻译 单元 >)。 

用 语法 的 产生 式 规 则 来 描述 编程 语言 的 方法 称 为 巴 科 斯 范式 ( Backus Naur Form, 
BNF). #2 BNF 中 , 产生 式 符号 一 有 时 写作 ::=。 设 计 于 1960 年 的 语言 Algol 60 使 得 BNF 
流行 了 起 来 。 

下 面 这 个 示例 是 该 语法 的 分 析 ， 表 明 如 果 S1 是 一 个 合法 的 <expression> (< 表达 式 >)， 





那么 
while (a <= 9 ) 
Sl; 
也 是 合法 的 <statement>。 该 语法 分 析 包 含 了 图 7-9 中 的 推导 。 


<statement> 
<iteration-statement> 
while <expression> ) <statement> 
while <relational-expression> ) <statement> 
while <relational-expression> <= <additive-expression> ) <statement> 
while ( <additive-expression> <= <additive-expression> ) <statement> 
while ( <multiplicative-expression> <= <additive-expression> ) <statement> 
while ( <unary-expression> <= <additive-expression> ) <statement> 
while ( <primary-expression> <= <additive-expression> ) <statement> 
while ( <identifier> <= <additive-expression> ) <statement> 
while <letter> <= <additive-expression> ) <statement> 
while ( a <= <additive-expression> ) <statement> 

a <multiplicative-expression> ) <statement> 


<unary-expression> ) <statement> 


while 
while 
while <primary-expression> ) <statement> 
while <constant> ) <statement> 
while <integer-constant> ) <statement> 
while <digit> ) <statement> 
while 9 ) <statement> 


while 9 ) <expression-statement> 


ma FAR RAR RR RR RR RR RR RK 


op poppe wp w 


while 9 ) <expression> ; 


9 ) SI; 
图 7-9 对 图 7-8 的 语法 ，while (a<=9) S1; 非 终结 符 <statement> 的 推导 





=> 
= 
= 
=> 
= 
=> 
=> 
=> 
=> 
=> 
=> 
=> 
一 
= 
=> 
=> 
=> 
=> 
= 
=> 
= 


=~ 


*while 
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图 7-10 给 出 了 这 个 分 析 对 应 的 语法 树 。 非 终结 符 <statement> 是 树 根 ， 因 为 这 个 分 析 的 
目的 是 要 证 明 该 字符 串 是 一 个 合法 的 <statement>。 


<statement> 
<iteration-statement> 
while ( <expression> ) <statement> 


ional- io 
<relational-expression> <expression-statement> 


<relational-expression> <= <additive-expression> <expression> 
| i 
<additive-expression> <multiplicative-expression> 5 7 
| | 
<multiplicative-expression> <unary-expression> 
| | 
<unary-expression> <primary-expression> 
<primary-expression> <constant> 
| | 
<identifier> <integer-constant> 
<letter> <digit> 
| | 
a 9 


图 7-10 FA 7-9 中 while (a<=9) S1; 非 终 结 符 <statement> 的 语句 分 析 的 语法 树 


记 住 这 个 例子 ， 思 考 C 编译 器 的 任务 。 将 编译 器 编写 为 包含 一 组 产生 式 规则 ， 类 似 
于 图 7-8 那样 的 规则 。 程 序 员 向 编译 器 提交 一 个 包含 源 程序 的 文本 文件 ， 就 是 一 个 长 长 
的 终结 符 字符 串 。 首 先 ， 编 译 器 必须 确定 这 个 终结 符 字 符 串 表 示 的 是 不 是 一 个 合法 的 C 
<translation-unit>。 如 果 是 ， 那 么 编译 器 就 必须 生成 相应 的 低级 语言 表示 的 目标 代码 。 如 果 
不 是 ， 编 译 器 必须 产生 适当 的 语法 错误 提示 。 

标准 C 语法 中 有 上 百 条 产生 式 规则 。 想 象 C 编译 器 的 工作 量 吧 ! 每 次 提交 程序 时 ， 它 
都 要 在 这 些 产 生 式 规 则 中 排序 遍历 。 幸 运 的 是 ， 计 算 机 科学 理论 发 展 至 今 已 经 能 够 使 编译 器 
的 语法 分 析 不 那么 困难 。 使 用 当前 理论 设计 出 的 C 编译 器 保证 在 程序 分 析 中 推导 的 每 一 步 
蔡 换 都 能 够 选择 正确 的 产生 式 。 如 果 分 析 算 法 不 能 找到 匹配 源 程序 的 <translation-unit> 的 推 
导 ， 就 能 够 证 明 这 样 的 推导 是 不 存在 的 ， 提 交 的 源 程序 一 定 有 语法 错误 。 

对 编译 器 来 说 ， 代 码 生 成 比 语法 分 析 更 难 一 些 。 究 其 原因 是 目标 代码 必须 运行 在 某 个 制 
造 厂商 生产 的 某 种 特定 的 机 器 上 。 因 为 每 个 厂商 的 机 器 架构 都 不 同 ， 指 令 集 也 不 同 ， 所 以 
一 种 机 器 的 代码 生成 技术 可 能 不 适用 于 另 一 种 机 器 。 不 存在 一 种 单一 标准 的 基于 理论 概念 的 
汉 诺 依 曼 架 构 。 这 就 导致 没有 出 现 太 多 关于 代码 生成 的 理论 能 够 指导 编译 器 设计 者 构建 编 
译 器 。 


7.1.10 C 的 上 下 文 相关 性 
从 图 7-8 来 看 C 语 言 貌似 是 上 下 文 无 关 的 。 每 个 产生 式 规则 的 左边 都 只 有 一 个 非 终 结 
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符 。 这 与 图 7-3 所 示 的 上 下 文 相关 语法 是 不 同 的 ， 上 下 文 无 关 语法 中 允许 产生 式 左 边 有 多 于 
一 个 的 非 终结 符 。 外 表 看 上 去 是 很 有 坎 骗 性 的 。 虽 然 C 语法 的 这 个 子 集 和 完整 的 C 语言 标 
准 都 是 上 下 文 无 关 的 ， 但 是 C 语言 本 身 的 某 些 方面 是 上 下 文 相关 的 。 

来 看 一 看 图 7-3 中 的 语法 。 它 的 产生 式 规 则 怎么 保证 字符 串 结尾 的 c 的 个 数 必 须 等 于 开 
头 a 的 个 数 ? 规则 1 和 2 保证 每 生成 一 个 a， 都 会 生成 一 个 C。 规 则 3 让 C 交换 到 B 的 右 
边 。 最 后 ， 规 则 5 允许 在 C 的 左边 有 bb 的 情况 下 ， 用 c 替代 C。 没 有 办 法 用 上 下 文 无 关 语 法 
描述 这 个 语言 ， 因 为 它 需 要 规则 3 和 5 让 C 到 字符 串 的 末尾 。 

C 语言 有 上 下 文 相关 的 一 面 ， 这 在 图 7-8 中 没有 表现 出 来 。 例 如 , <parameter-list> (< 形 
EIR >) 的 定义 允许 任意 数量 的 形 参 ， 而 <argument-expression-list> (< 实 参 表达 式 列表 >) 
的 定义 允许 任意 数量 的 实 参 。 可 以 写 一 个 C 程序 包含 一 个 具有 3 个 形 参 的 过 程 ， 以 及 一 个 
有 2 个 实 参 的 过 程 调用 ， 这 个 程序 可 以 用 图 7-8 中 的 语法 从 <translation-unit> 推导 出 来 。 但 
是 如 果 想 编译 这 个 程序 ， 编 译 器 会 报 一 个 语法 错误 。 

C 中 形 参 的 数量 必须 等 于 实 参 的 数量 ， 类 似 于 图 7-3 中 语法 定义 的 字符 串 开 头 时 的 a 的 
个 数 必须 等 于 结尾 处 c 的 个 数 。 要 想 对 C 的 语法 做 出 这 个 限制 ， 就 需要 包括 一 些 更 为 复杂 
的 、 上 下 文 相关 的 规则 。 让 编译 器 用 上 下 文 无 关 语 法 分 析 一 个 程序 ， 之 后 再 检查 是 否 违反 一 
些 规 则 ， 这 样 更 简单 一 些 。 通 常 借助 于 符号 表 来 检查 是 否 有 违反 这 些 语 法 不 能 描述 的 规则 。 


7.2 ”有限 状态 机 


男 一 种 描述 语言 中 句子 句法 的 方式 是 有 限 状态 机 ( FSM)。 以 图 的 形式 表示 ， 有 限 状态 
机 就 是 一 个 状态 的 有 限 集 合 ， 状 态 用 圆圈 表示 ， 称 为 结 点 ， 状 态 间 的 转换 用 圆圈 之 间 的 弧 表 
示 。 每 条 弧 从 一 个 状态 开始 ， 到 另 一 个 状态 结束 ， 在 结束 状态 有 一 个 箭头 。 每 条 弧 上 都 还 有 
一 个 标号 ， 是 该 语言 终结 符 表 中 的 一 个 字符 。 

有 限 状 态 机 中 的 一 个 状态 被 指定 为 起 始 状 态 ， 至 少 一 个 ， 也 可 以 多 个 状态 被 指定 为 终止 
状态 。 在 图 中 ， 起 始 状态 有 一 个 输入 箭头 ， 而 终止 状态 用 双 圈 表示 。 

数学 上 ， 这 样 一 组 以 弧 连 接 的 结 点 称 作 图 。 当 弧 有 方向 时 (FSM 就 是 这 样 )， 称 为 有 向 
图 (directed graph 或 digraph ) 。 


7.2.1 用 有 限 状态 机 分 析 标 识 入 字母 


图 7-11 给 出 了 一 个 FSM， 它 分 析 图 7-1 中 语法 定义 字母 数字 
的 标识 符 。 状 态 集 合 是 (A, B, C), A 是 起 始 状态 ，B 是 Oe 


终止 状态 。 对 一 个 字母 有 A 到 B 的 转换 ， 对 一 个 数字 有 数字 数字 
A 到 C 的 转换 ， 对 一 个 字母 或 数字 有 B 到 B 的 转换 ， 对 字母 
一 个 字母 或 数字 有 C 到 C 的 转换 。 

要 使 用 FSM， 可 以 假想 输入 字符 串 写 在 一 张 纸 带 上 。 图 7-11 分 析 标识 符 的 FSM 


从 起 始 状态 开始 ， 从 左 至 右 扫描 输入 纸 带 上 的 字符 。 每 
次 从 纸 带 上 扫描 到 下 一 个 字符 时 ， 就 转换 到 有 限 状 态 机 的 下 一 个 状态 上 。 只 能 使 用 弧 上 标识 
的 字符 与 扫描 进来 的 字符 一 致 的 那些 转换 。 在 扫描 所 有 的 输入 字符 之 后 ， 如 果 字 符 在 终止 状 
态 中 ， 那 么 这 个 字符 串 就 是 一 个 合法 的 标识 符 ， 否 则 就 不 是 。 

要 分 析 字 符 串 cab3， 需 要 做 下 面 这 样 的 转换 : 

当前 状态 : A 输入 : cab3 扫描 c， 转 换 到 状态 B。 
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当前 状态 : B 输入 : ab3 扫描 a， 转 换 到 状态 B。 
当前 状态 : B 输入 : b3 扫描 b， 转 换 到 状态 B。 
当前 状态 : B 输入 : 3 扫描 3， 转 换 到 状态 B。 
当前 状态 : B 输入 : 检查 是 否 是 终止 状态 。 
因为 没有 输入 了 ， 所 以 最 后 的 状态 是 B， 是 终止 状态 ，cab3 就 是 一 个 合法 的 标识 符 。 a 


还 可 以 用 状态 转换 表 来 表示 FSM。 图 7-12 是 
图 7-11 AY FSM 的 状态 转换 表 ， 表 中 列 出 了 从 一 个 给 定 
的 当前 状态 在 给 定 输入 符号 时 转换 到 的 下 一 个 状态 。 


7.2.2 简化 的 有 限 状态 机 


通常 通过 消除 FSM 中 的 一 些 状态 ， 对 图 进行 简化 
会 更 方便 ， 比 如 删除 那 种 存在 的 唯一 目的 就 是 为 非法 输 
入 字符 提供 转换 的 状态 。 这 个 状态 机 中 的 状态 C 就 是 这 
么 一 种 状态 。 如 果 第 一 个 字符 是 数字 ， 那 么 不 论 其 后 跟 
了 什么 字符 ， 字 符 串 都 不 是 合法 标识 符 。 状 态 C 就 是 一 
个 失败 状态 。 一 旦 转换 到 状态 C， 就 永远 没 办 法 转换 到 
其 他 的 状态 ， 输 入 字符 串 最 终 会 被 认定 为 非法 。 图 7-13 
给 出 了 图 7-11 的 FSM 的 简化 版 本 , 没有 了 失败 状态 。 

用 这 个 简化 的 状态 机 分 析 字 符 串 时 ， 在 输入 字符 上 串 
中 遇 到 非法 字符 时 ， 没 有 办 法 进行 转换 。 有 两 种 方法 能 
在 简化 的 状态 机 中 检测 出 非法 句子 : 

e 没有 输入 ， 但 是 却 不 在 一 个 终止 状态 中 。 

© 在 某 个 状态 中 ,但 是 该 状态 没有 与 下 一 个 输入 字 

符 相 对 应 的 转换 。 

图 7-14 是 图 7-13 对 应 的 状态 转换 表 。 对 于 去 掉 的 
转换 ， 简 化 状态 机 对 应 的 状态 转换 表 中 没有 对 应 的 条 
目 。 注意 ， 这 张 表 在 当前 状态 A 的 数字 一 栏 中 是 没有 内 
容 的 。 本 章 余下 部 分 中 的 状态 机 都 使 用 简化 的 格式 。 


7.2.3” 非 确定 性 有 限 状态 机 


当 使 用 语法 分 析 句 子 时 ， 对 于 一 个 推导 步 又 通常 必 
须 在 多 个 产生 式 规则 中 选择 用 哪个 进行 蔡 换 。 类 似 地 ， 
非 确 定性 有 限 状 态 机 要 求 在 分 析 输 入 字符 串 时 从 多 个 转 
换 中 选择 。 图 7-15 是 一 个 分 析 有 符号 整数 的 非 确 定性 
FSM。 称 为 非 确定 ， 因 为 至 少 有 一 个 状态 对 于 一 个 字符 
有 多 于 一 种 转换 。 例 如 ， 状 态 A 对 于 一 个 数字 可 以 转换 
到 B 也 可 以 转换 到 C。 对 于 状态 B 也 有 一 些 不 确定 性 ， 
如 果 下 一 个 输入 字符 是 一 个 数字 ， 转 换 到 B 或 者 C 都 有 
可 能 。 








图 7-12 图 7-11 中 FSM 的 状态 转 
换 表 


字母 
开始 A 字母 
数字 


图 7-13 ”无 失败 状态 的 图 7-11 的 有 
限 状 态 机 





—> A B 
(B) | B B 

图 7-14 图 7-13 P FSM 的 状态 转 
换 表 


数字 
数字 
十 
人 EG 
数字 数字 
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图 7-15 分 析 有 符号 整数 的 非 确 定 
性 FSM 


用 这 个 非 确定 性 FSM 来 分 析 +203， 必 须要 做 下 面 这 样 一 些 决策 : 
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当前 状态 : A 输入 : +203 扫描 +， 转 换 到 状态 B。 
当前 状态 : B 输入 : 203 扫描 2， 转 摘 到 状态 B。 
当前 状态 : B 输入 : 03 扫描 0， 转 换 到 状态 B。 
当前 状态 : B 输入 : 3 扫描 3， 转 换 到 状态 C。 
当前 状态 : C 输入: 检查 是 否 是 终止 状态 。 


因为 没有 输入 又 处 于 终止 状态 C 中 ， 所 以 这 证 明了 输入 字符 串 +203 是 一 个 合法 的 有 符 


号 整数 。 


在 用 产生 式 规 则 进行 分 析 时 ， 有 出 现 前 面 的 分 析 可 能 做 出 不 正确 选择 的 风险 。 可 能 进入 
一 个 死 衣 同 ， 没 有 替换 能 使 得 终结 符 和 非 终结 符 组 成 的 中 间 字 符 串 更 接近 给 定 的 字符 串 。 进 
和 人 这 样 的 死胡同 并 不 一 定 就 表示 该 字符 串 是 非法 的 。 所 有 的 非法 字符 串 在 任何 尝试 中 都 会 进 
入 死胡同 ,但 是 如 果 在 前 面 的 推导 中 决策 错误 ,合法 的 字符 串 也 有 可 能 产生 死胡同 。 

对 于 非 确定 性 有 限 状 态 机 ， 同 样 有 这 个 问题 。 对 于 图 7-15 中 的 状态 机 ， 如 果 在 起 始 状 
态 A 中 , 下 一 个 输入 字符 是 7， 那 就 必须 在 转换 到 B 还 是 C 之 间 选 择 。 假 设 选择 转换 到 C, 


然后 发 现 还 有 一 个 输入 字符 要 扫描 。 因 为 从 C 
没有 转换 出 来 ， 所 以 这 次 分 析 尝 试 进入 了 死 胡 
同 。 因 此 你 得 出 结论 ， 输入 字符 串 是 非法 的 ; 
或 者 字符 串 是 合法 的 ， 只 是 在 前 面 某 个 地 方 做 
出 了 错误 的 选择 。 

图 7-16 是 图 7-15 中 状态 机 的 状态 转换 
表 。 非 确定 性 很 明显 ， 数 字 栏 中 有 多 项 (B， 
C)， 它 们 表示 在 尝试 分 析 时 需要 进行 选择 。 


7.2.4 具有 空转 换 的 状态 机 


在 产生 式 规 则 中 引入 空 字符 串 会 带 来 方 
便 ， 同 样 ， 构 建 具 有 对 空 字 符 串 转换 的 有 限 
状态 机 也 会 带 来 方便 。 这 样 的 转换 称 为 空转 
换 。 图 7-18 是 图 7-17 中 的 FSM 的 状态 转换 
表 。 图 7-17 是 一 个 FSM， 对 应 于 图 7-2 中 的 
语法 ， 用 来 分 析 有 符号 整数 。 





图 7-16 图 7-15 中 FSM 的 状态 转换 表 


ODL 


图 7-17 具有 空转 换 的 分 析 有 符号 整数 的 FSM 





图 7-18 图 7-17 中 FSM 的 状态 转换 表 
在 图 7-17 F, F 是 输入 第 一 个 字符 后 的 状态 ，M 是 数值 状态 ， 类 似 于 语法 中 的 非 终结 
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符 F 和 M。 同样 ,符号 可 以 是 +、 一 或 者 两 者 都 不 是 ， 从 I 到 下 的 转换 可 以 接受 +、- 或 e 。 
分 析 32， 做 出 如 下 决策 : 


当前 状态 : I 输入 : 32 扫描 © ， 转 换 到 状态 上 ， 
当前 状态 : F 输入 : 32 扫描 3， 转 换 到 状态 M。 
当前 状态 : M 输入 : 2 扫描 2， 转换 到 状态 M。 
当前 状态 : M HA: 检查 是 否 是 终止 状态 。 


接受 e 从 I 到 下 的 转换 不 消耗 输入 字符 。 当 处 于 状态 TI 时， 可 以 做 3 件 事 情 中 的 一 件 : 
a) 扫描 +， 进 入 状态 F ; b) 扫描 一 ， 进 入 状态 F ; 或 者 ec) 什么 也 不 扫描 (也 就 是 ， 空 字符 
串 )， 进 人 状态 F。 a 

具有 空转 换 的 状态 机 总 被 认为 是 非 确 定性 的 。 在 例 7.6 中 ， 非 确定 性 来 自 当 在 状态 I 中 
而 下 一 个 字符 是 + 时 必须 做 出 决策 ， 必 须 决定 是 从 I 到 下 接受 +， 还 是 从 I 到 了 接受 es。 这 
是 不 同 的 转换 ， 因 为 虽然 它们 转换 到 同一 个 状态 ， 但 是 剩 下 的 输入 字符 串 是 不 同 的 。 

给 定 一 个 带 有 空转 换 的 FSM， 总 是 可 以 把 它 变换 为 一 个 等 价 的 、 不 带 有 空转 换 的 有 限 
状态 机 。 消 除 空 转换 的 算法 分 为 两 步 : 

e 如 果 有 一 个 转换 接受 e Mp 到 q， 对 于 每 个 接受 a 从 q 到 r 的 转换 ， 增 加 一 个 接受 a 

从 p 到 r 的 转换 。 
e 如 果 q 是 一 个 终止 状态 ,把 p 也 变 成 终止 状态 。 
这 个 算法 使 用 s 的 连接 属性 : 
€ 3 一 8 

CED 图 7-19 展示 了 如 何 从 a 中 的 状态 机 中 消除 空转 换 ， 得 到 等 价 的 b 中 的 状态 机 。 
因为 有 一 个 接受 e 从 状态 X 到 状态 Y 的 转换 ， 以 及 一 个 接受 a 从 状态 YY 到 状态 Z WHER, 
所 以 构造 一 个 接受 a 从 状态 X 到 状态 Z 的 转换 ， 就 可 以 消除 这 个 空转 换 了 。 如 果 在 状态 X 
中 ， 可 以 直接 接受 a 进 入 状态 Z， 这 和 直接 接受 s 从 XX 经 过 Y 到 达 Z， 进 入 的 状态 和 剩 下 


的 输入 都 是 一 样 的 。 z 
a 
€ 
开始 开始 
ma AD * + mes o 
a) 原始 FSM b) 无 空转 换 的 等 从 FSM 


图 7-19 消除 空转 换 


GE 图 7-20 给 出 了 对 图 7-17 的 FSM 的 变换 。 从 I 到 下 的 空转 换 被 替换 为 接受 数字 
的 从 I 到 M 的 转换 ， 因 为 有 一 个 接受 数字 从 F 到 M 的 转换 。 z 


ODL ODL 
_ 数字 
€ 


a) 原始 FSM b) 消除 了 空转 换 
图 7-20 消除 图 7.17 & FSM 中 的 空转 换 
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在 例 7.8 中 从 F 到 M 只 有 一 个 转换 ， 所 以 从 1 到 F 的 空转 换 只 用 替换 为 一 个 从 I 到 M 
的 转换 。 如 果 一 个 FSM 有 多 个 转换 来 自 空 转换 的 目标 状态 ， 那 么 在 消除 空转 换 时 ， 就 必须 
添加 多 条 转换 。 

要 消除 图 7-21a 中 W 到 X 的 空转 换 ， 需 要 用 两 个 转换 来 替换 它 ， 一 个 是 接受 a 的 
从 W 到 Y， 另 一 个 是 接受 b 的 从 W 到 Z。 在 这 个 例子 中 ， 因 为 X 是 图 7-21a 的 终止 状态 ， 所 


以 W 就 成 为 图 7-20b 中 等 价 状态 机 的 一 个 终止 状态 ， 与 算法 中 的 第 二 步 保持 一 致 。 m 
© 9 
开始 开始 2 一 
“6 a 
@) @) 
a) 原始 FSM b) 无 空转 换 的 等 价 FSM 


图 7-21 消除 空转 换 


图 7-17 消除 了 空转 换 就 得 到 一 个 确定 性 的 状态 机 。 不 过 ， 一 般 来 说 ， 消 除 所 有 的 空转 
换 并 不 能 保证 得 到 的 FSM 就 是 确定 性 的 。 虽 然 所 有 带 有 空转 换 的 状态 机 都 是 非 确定 性 的 ， 
但 是 不 带 有 空转 换 的 FSM 仍然 有 可 能 是 非 确定 性 的 。 图 7-15 就 是 这 样 一 个 例子 。 

如 果 有 选择 的 话 ， 用 确定 性 的 FSM 分 析 总 比 用 非 确定 性 的 FSM 好 。 使 用 确定 性 的 状态 
机 ， 对 于 合法 的 输入 字符 串 是 不 可 能 做 出 错误 的 选择 而 进入 死胡同 的 。 一 旦 出 现 终 止 在 死 昌 
同 里 的 情况 ， 就 可 以 得 出 结论 该 输入 字符 串 是 非法 的 。 

计算 机 科学 家 已 经 证 明 每 个 非 确定 性 的 FSM 都 有 一 个 等 价 的 确定 性 的 FSM， 也 就 是 
说 ， 有 一 个 确定 性 的 状态 机 能 够 识别 完全 一 样 的 语言 。 不 过 对 这 个 很 有 用 结论 的 证 明 超出 了 
本 书 的 范围 ， 证 明 的 大 概 思 路 就 是 说 明 如 何 从 一 个 非 确定 性 的 状态 机 构造 出 等 价 的 确定 性 的 
状态 机 。 


7.2.5 多 语言 符号 识别 器 

语言 符号 ( token) 是 一 个 终结 符 的 字符 串 ， 作 为 一 个 整体 它 有 特殊 的 含义 。 这 组 字符 通 
常 对 应 于 语言 语法 中 的 某 个 非 终结 符 。 例 如 ， 看 看 下 面 这 个 Pep/9 汇编 语言 语句 : 

mask: .WORD Ox0OFF 


这 个 语句 中 的 token 是 mask:、.WORD 0x0 0FF。 每 个 字符 组 都 来 自 于 汇编 语言 符号 
表 ， 组 合 到 一 起 具有 特殊 的 含义 。 这 里 每 个 token 的 含义 分 别 是 符号 定义 、 点 命令 和 十 进 制 
常数 。 

从 某 种 程度 上 说 ， 可 以 任意 选择 哪个 符号 组 来 表示 哪个 token。 例 如 ， 可 以 选择 字符 串 
Ox 和 00FF 表示 不 同 的 token，0x 是 前 级 ，00FF 是 数值 。 通 常 选择 使 得 FSM 的 实现 尽 可 能 
简单 的 token 字符 。 

在 翻译 器 中 FSM 常见 的 使 用 是 在 源 字符 串 中 识别 token。 考 虑 汇编 器 在 收 到 源 字符 串 时 
的 工作 。 假 设 汇编 器 已 经 确定 mask: 是 符号 定义 ，.WORD 是 点 命令 ， 并 且 知 道 点 命令 后 可 
以 是 一 个 十 进 制 或 十 六 进 制 常数 ， 所 以 必须 编程 接受 它们 。 需 要 FSM 能 够 识别 出 两 者 。 
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图 7-22a 给 出 了 分 析 十 六 进 制 常数 和 无 符号 整数 的 两 个 状态 机 。D 是 第 一 个 状态 机 的 终 
止 状态 , F 是 第 二 个 分 析 无 符号 整数 的 状态 机 的 终止 状态 。 十 六 进 制 常数 的 首位 是 数字 0, 
其 后 是 小 写 的 x 或 大 写 的 X， 然 后 再 跟 一 个 或 多 个 十 六 进 制 数字 , 即 0 一 9.a 一 f 或 A 一 F。 
在 第 二 个 状态 机 中 ， 数 字 范 围 是 0 ~ 9。 


十 六 进 制 数字 十 六 进 制 数字 







x 十 六 进 制 数字 
X 





®© Lid © 数字 


a) 分 别 对 应 十 六 进 制 常数 和 无 符号 b) 识别 十 六 进 制 常数 和 无 符号 整数 
十 进 制 整数 的 状态 机 token 的 一 个 非 确定 性 FSM 


图 7-22 把 两 个 状态 机 合并 得 到 一 个 能 够 识别 两 种 token 的 FSM 


要 构建 一 个 能 够 识别 十 六 进 制 常 数 和 无 符号 整数 的 FSM， 首 先 要 画 一 张 新 的 合并 后 的 
状态 机 的 起 始 状态 ， 即 图 7-22b 中 的 状态 G。 然 后 再 画 出 从 新 的 起 始 状态 到 每 个 单独 状态 机 
中 起 始 状 态 的 空转 换 ， 在 本 例 中 是 G 到 A 和 G 到 E。 结 果 就 得 到 一 个 可 以 识别 两 种 token 
的 非 确定 性 的 FSM。 结 束 的 终止 状态 表明 已 经 识别 出 了 该 token。 分 析 完 成 后 ， 如 果 终 止 在 
状态 D， 就 表明 识别 出 的 是 十 六 进 制 常数 ， 如 果 终 止 在 状态 F 中， 就 表明 识别 出 的 是 无 符号 
整数 。 

要 想 让 这 个 状态 机 的 形式 能 更 方便 使 用 ， 就 要 消除 空转 换 。 图 7-23a 给 出 了 图 7-22b 中 
FSM 消除 空转 换 后 的 状态 机 。 消 除 空 转换 之 后 ， 状 态 A 和 E 是 不 可 达 的 。 也 就 是 说 ， 无 论 
输入 字符 串 是 什么 ， 永 远 无 法 从 起 始 状态 到 达 这 些 状 态 。 所 以 它们 不 会 影响 到 分 析 ， 可 以 从 
状态 机 中 去 除 ， 得 到 图 7-23b 所 示 的 图 。 

十 六 进 制 数字 
十 六 进 制 数字 





a) 消除 空转 换 b) 移 除 不 可 达 的 状态 
图 7-23 ”对 图 7-22b 中 FSM 的 变换 
下 面 是 另 一 个 例子 ， 说 明了 翻译 器 需要 识别 出 多 个 token。 思 考 在 遇 到 下 面 这 样 两 行 源 
代码 时 汇编 器 的 工作 : 


NOTE: LDWA this,d ;comment 1 
NOTA ;comment 2 


第 一 行 上 第 一 个 token 是 符号 定义 ， 第 二 行 上 第 一 个 token 是 一 元 指令 的 助 记 符 。 在 每 
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一 行 的 开头 ， 翻 译 器 需要 FSM 能 够 识别 出 符号 定义 ( 它 的 形式 是 标识 符 后 面 跟 一 个 分 号 ) 
或 助 记 符 ( 它 的 形式 是 标识 符 )。 图 7-24 就 是 这 样 一 个 多 token FSM. 

对 于 第 一 行 ， 这 个 状态 机 做 出 如 下 转换 : 

接受 N,， 从 A 到 B 

#20, 从 B 到 B 

4% T, 从 B 到 B 开始 字母 

HEE, 从 B 到 B meets) 

接受 :， 从 B 到 C 

当 停 在 终止 状 态 C 时， 翻译 器 知道 它 识别 图 7.24 分 析 Pepp 汇编 语言 标识 符 或 符号 
出 了 一 个 符号 定义 。 对 于 第 二 行 ， 它 做 出 如 下 StU FSM 
转换 : 

接受 N， 从 A 到 了 B 

接受 0, 从 B 到 B 

接受 T， 从 B 到 B 

接受 A,， 从 B 到 B 

因为 接 下 来 的 输入 符号 不 是 分 号 ， 所 以 FSM 不 会 转换 到 状态 C。 此 时 ， 翻 译 器 知道 它 
识别 出 了 一 个 标识 符 ， 因 为 终止 状态 是 B。 


7.2.6 语法 与 有 限 状 态 机 


语法 和 FSM 在 能 力 上 是 不 相等 的 。 在 这 两 者 中 ， 语 法 比 FSM 更 强大 。 也 就 是 说 ， 有 些 
语言 的 句法 规则 如 此 复杂 ， 即 使 它们 能 用 语法 来 描述 ， 也 不 能 用 FSM 来 描述 。 另 一 方面 ， 
任何 一 种 语言 如 果 它 的 句法 规则 简单 到 能 用 FSM 来 描述 ， 那 么 也 可 以 用 语法 来 描述 。 

图 7-1 是 标识 符 的 语法 ， 图 7-13 是 标识 符 的 FSM。 形 成 合法 标识 符 的 规则 是 : 第 一 个 
字符 必须 是 字母 ， 剩 余 字 符 必须 是 字母 或 数字 。 这 些 规则 很 简单 ， 因 此 ， 既 可 以 用 语法 来 说 
明 ， 也 可 以 用 FSM 来 说 明 。 

图 7-5 是 表达 式 的 语法 。 表 达 式 的 语言 非常 复杂 ， 从 数学 上 来 说 ， 不 可 能 指定 一 个 FSM 
来 分 析 表达 式 。 表 达 式 FSM 的 问题 是 可 以 有 无 限 嵌 套 的 圆 括 号 。 当 FSM 扫描 到 一 个 左 括号 
时 ， 它 转换 到 的 状态 必须 知道 有 一 级 嵌 套 。 当 PSM 扫描 到 另 一 个 左 括号 时 ， 它 转换 到 的 状 
态 必 须知 道 现在 是 二 级 嵌 套 。 然 后 ， 如 果 扫 描 到 一 个 右 括号 ， 它 就 必须 转换 回 表示 一 级 巾 套 
的 状态 。FSM 继续 扫描 左 括号 和 右 括号 ， 并 转换 到 适合 各 个 嵌 套 级 别 的 状态 。 对 一 个 合法 
表达 式 的 检测 ， 其 最 后 的 状态 必须 是 不 包含 嵌 套 的 。 

表达 式 典 套 的 语法 没有 数学 上 的 限制 。 因 此 ， 为 了 构建 一 个 等 效 的 FSM， 就 不 能 限制 
状态 的 数量 。 但 是 FSM 的 状态 一 定 是 有 限 的 。 所 以 ， 为 表达 式 指定 FSM 是 不 可 能 的 。 

虽然 对 正则 表达 式 的 描述 超出 了 本 书 的 范 
围 ， 但 是 它们 究竟 有 多 强大 ? 事实 证 明 ， 每 个 正 
则 表达 式 都 有 一 个 等 价 的 FSM， 而 每 个 FSM 都 
有 一 个 等 价 的 正则 表达 式 。 因 此 ，FSM 和 正则 表 lim 
达 式 在 能 力 上 是 等 价 的 ， 两 者 都 不 如 语法 强大 。 fe 1138 


图 7.25 展示 了 语言 语法 的 三 种 说 明 方法 在 能 力 


上 的 关系 。 图 7-25 语法 、FSM 和 正则 表达 式 的 能 力 
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7.3 实现 有 限 状 态 机 


本 章 剩余 的 部 分 将 展示 语言 翻译 器 如 何 把 一 个 源 程序 转换 为 目标 程序 。 这 里 用 Java if 
言 而 不 是 C 来 说 明 翻 译 技术 。Java 语言 的 句法 与 C 类 似 ， 具 有 面向 对 象 的 优点 。Java 为 输 
和 人 和 输出 提供 了 丰富 的 图 形 用 户 界面 (GUI) 元 素 扩展 库 。 本 章 的 程序 从 单一 输入 窗口 获取 
输入 ， 其 形式 为 一 串 终结 符 ; 并 把 翻译 结果 发 送 到 标准 输出 窗口 。 从 本 书 的 软件 可 以 获得 没 
有 显示 的 GUI 编程 细节 。 

Java 自身 是 基于 Java 虚拟 机 (JVM) 的 解释 语言 。 图 7-26 展示 了 编译 语言 和 解释 语言 
的 差异 。 图 7-26a 显示 了 编译 语言 的 翻译 过 程 ， 如 C 语言 。 计 算 过 程 中 的 每 次 运行 都 执行 一 
个 带 有 输入 和 输出 的 机 器 语言 程序 。 第 一 次 运行 时 ，C 编译 器 把 高 级 语言 编写 的 源 代码 转换 
为 机 器 语言 的 目标 代码 。 第 二 次 运行 时 ， 执 行 机 器 语言 目标 代码 ， 处 理应 用 程序 的 输入 ， 生 
成 应 用 程序 的 输出 。 


输入 处 理 输出 








应 用 程序 输入 应 用 程序 输出 
输入 输出 





翻译 机 器 语言 目标 字 节 码 


Y 
虚拟 机 机 器 语言 


b) 解释 
图 7-26 编译 与 解释 之 间 的 差异 


图 7-26b 显示 了 解释 语言 的 翻译 过 程 ， 如 Java 和 Pep/9， 两 者 都 是 基于 虚拟 机 的 。 第 一 
次 运行 时 ， 目 标 代码 是 字 节 码 ， 而 不 是 机 器 语言 。 第 二 次 运行 时 ， 目 标 代 码 不 是 直接 执行 
的 。 相 反 ， 虚 拟 机 带 上 两 个 输入 源 执 行 ， 一 个 是 第 一 次 运行 产生 的 目标 字 节 码 ， 一 个 是 应 用 
程序 输入 。 

解释 的 优点 包括 编译 速度 快 和 便于 移植 。 编 译 为 字 节 码 更 快 是 因为 字 节 码 比 机 器 码 的 抽 
象 层 次 更 高 ， 因 此 也 就 更 容易 翻译 。 图 2-3 显示 了 像 C 这 样 的 编译 语言 是 怎样 实现 其 平台 独 
立 性 的 ， 语 言 维护 者 必须 为 每 个 平台 配 一 个 编译 器 。 而 对 于 像 Java 那样 的 解释 语言 ， 相 同 
的 编译 器 适用 于 所 有 的 平台 ,语言 维护 者 只 需要 为 所 有 平台 提供 一 个 虚拟 机 。 这 比 提供 不 同 
的 编译 器 更 简单 。 

解释 的 缺点 是 ， 其 执行 速度 比 编译 慢 。 在 执行 期 间 ， 应 用 程序 不 会 直接 执行 。 相 反 ， 执 
行 的 是 虚拟 机 。 运 行 时 ,这 一 由 虚拟 机 提供 的 额外 的 抽象 层 ， 使 得 解释 程序 的 执行 速度 一 般 
都 慢 于 等 效 的 编译 程序 的 执行 速度 。 
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7.3.1 编译 过 程 


编程 语言 的 句法 通常 用 形式 语法 来 描述 ， 这 是 翻译 器 分 析 算 法 的 基础 。 不 像 图 7-8 中 的 
语法 那样 描述 所 有 的 句法 ,形式 语法 通常 只 描述 较 高 层次 的 抽象 ， 把 低层 次 留 给 正则 表达 式 
或 有 限 状 态 机 来 描述 。 

图 7-27 描述 了 一 个 典型 编译 过 程 中 的 步骤 。 低 层次 的 句法 分 析 称 为 词法 分 析 (lexical 
analysis)， 高 层次 的 句法 分 析 称 为 语法 分 析 ( parsing， 这 是 parse 更 专业 的 含义 ， 这 个 词 有 
时 也 宽泛 地 用 来 包括 所 有 的 句法 分 析 )。 在 大 多 数 人 工 语 言 的 翻译 器 中 ， 词 法 分 析 器 基于 
确定 性 的 FSM， 输入 是 一 个 字符 串 。 语 法 分 析 器 通常 基于 语法 ,输入 是 来 自 词法 分 析 器 的 

420| token 序列 。 


词法 分 析 器 分 析 器 
\ l — 
句法 


语义 
图 7-27 编译 过 程 中 的 步 又 


编译 过 程 的 每 一 个 阶段 都 是 从 它 前 一 个 阶段 获得 输入 ， 向 它 后 一 个 阶段 发 送 输出 。 对 每 
个 阶段 的 输入 和 输出 来 说 : 
词法 分 析 器 的 输入 是 来 自 源 程序 终结 符 表 的 一 个 符号 串 。 
词法 分 析 器 的 输出 和 语法 分 析 器 的 输入 是 语言 符号 流 。 
语法 分 析 器 的 输出 和 代码 生成 器 的 输入 是 语法 分 析 的 语法 树 ， 以 及 /或 以 内 部 低级 语 
言 编 写 的 源 程序 。 

o 代码 生成 器 的 输出 是 目标 程序 。 

词法 分 析 器 的 非 终结 符 是 语法 分 析 器 的 终结 符 。 这 样 的 符号 的 一 个 常见 例子 是 标识 符 。 
词法 分 析 器 的 FSM 的 终结 符 表 包 括 单个 的 字母 和 数字 ， 输 入 是 这 些 字 符 组 成 的 字符 串 ， 然 
后 进行 状态 转换 。 如 果 输 入 是 字符 串 abc3 ， 那 么 FSM 声明 说 识别 出 了 一 个 标识 符 ， 并 且 把 
该 信息 传递 给 语法 分 析 器 。 语 法 分 析 器 在 分 析 语 言 的 句子 时 ， 会 把 <identifier> (< 标识 符 >) 
作为 终结 符 。 

实现 FSM 的 算法 有 一 个 枚 举 型 变量 ， 称 为 状态 变量 (state variable)， 它 的 可 能 值 对 应 
F FSM 的 可 能 状态 。 算 法 把 状态 变量 初始 化 为 机 器 的 起 始 状态 ， 在 循环 的 每 一 次 中 获取 终 
结 符 字符 串 的 一 个 字符 。 每 个 字符 都 会 导致 状态 的 一 次 改变 。 有 两 种 常见 的 实现 技术 : 

e 查找 表 

e 直接 编码 

在 这 两 种 方法 中 ， 状 态 变 量 获取 它 下 一 个 值 的 方式 不 同 。 查 找 表 技术 存储 状态 转换 表 ， 
根据 当前 状态 和 输入 字符 查 表 获 得 下 一 个 状态 。 直 接 编码 技术 在 代码 中 检测 当前 状态 和 输入 
字符 ， 直 接 把 下 一 个 状态 赋值 给 状态 变量 。 


7.3.2 ”查找 表 分 析 器 


图 7-28 中 的 程序 用 查 表 技 术 实 现 了 图 7-11 的 FSM。 变 量 FSM 是 图 7-12 所 示 的 状态 转 
换 表 ， 它 是 一 个 二 维 整数 数组 。 程 序 把 输入 字符 分 成 字母 或 数字 。 因 为 B 是 终止 状态 ， 所 
以 如 果 循 环 结束 时 状态 是 B， 那 么 程序 会 声称 输入 字符 串 是 一 个 合法 的 标识 符 。 
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public static boolean isAlpha(char ch) { 
return ('a' <= ch && ch <= 'z') || ('A' <= ch && ch <= 


} 


// States 
static final i te 0; 
static final 
static final i i 2; 
// Alphabet 
static final int T_LETTER 
static final int T_DIGIT 
// State transition table 
static final int[][] FSM 
{S_B, S_C}, 
{S_B, S_ B}, 
{s_c, s_c} 


} 


public void actionPerformed(ActionEvent event) { 
String line = textField.getText () ; 
char ch; 
int FSMChar; 
int state = S A; 


for (int i = 0; i < line.length(); i++) { 


= line.charAt (i); 
FSMChar = isAlpha(ch) ? T_LETTER : T DIGIT; 
state = FSM[state] [FSMChar] ; 


} 
if (state == S B) { 

System.out.printf("$s is a valid identifier.\n", line); 
} else { 


System.out.printf("%s is not a valid identifier.\n", line); 


} 
输入 /输出 


Enter a string of letters and digits: cab3 


cab3 is a valid identifier. 


输入 /输出 
Enter a string of letters and digits: 3cab 


3cab is not a valid identifier. 





图 7-28 ”用 查找 表 技 术 实 现 图 7-11 的 FSM 


图 中 所 示 的 输入 和 输出 是 完整 程序 中 GUI 部 件 的 反映 ， 这 里 没有 显示 。 输 入 来 自 一 个 
对 话 框 ， 其 文本 框 的 上 方 标 有 “ Enter a string of letters and digits:”。 当 用 户 点 击 Parse 按钮 
时 ， 事 件 触发 器 执行 函数 actionPerformed()。 程 序 中 的 String 类 型 是 Java 不 可 变 的 字符 串 
类 型 。 函数 getText() 从 文本 输入 字段 中 检索 用 户 输入 ， 并 将 其 赋 给 变量 line. fort H A 
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数 charAt() 逐个 处 理 终结 字符 。 根 据 当 前 状态 和 当前 输入 在 FSM 表 中 查找 下 一 个 状态 。 

该 程序 假设 用 户 只 会 输入 字母 和 数字 。 如 果 用 户 输入 其 他 的 字符 ， 程 序 会 把 它 当 作 数 
字 。 例 如 ， 如 果 用 户 输入 cab#， 程序 会 认为 它 是 个 合法 的 标识 符 ， 而 实际 上 它 不 是 。 在 本 
章 末 尾 ， 留 给 读者 的 一 个 习题 就 是 改进 FSM 并 实现 它 。 


7.3.3 直接 编码 分 析 器 


图 7-29 中 的 程序 使 用 直接 编码 技术 来 分 析 整 数 ， 它 是 图 7-20b 中 FSM AY SEB. K 
数 actionPerformed() 允许 用 户 输 入 任意 字符 串 。 如 果 该 字符 串 不 是 合法 的 整数 ， 那 么 
parseNum 为 vaild 返回 false， 程 序 会 发 出 一 条 错误 消息 。 否 则 ，valid 为 true, number 是 输 
入 整数 的 正确 的 值 。 


public void actionPerformed (ActionEvent event) { 
String line = textPField.getText () ; 
Parser parser = new Parser(); 
parser .parseNum (line) ; 
if (parser.getValid()) { 
System.out.printf ("Number = d\n", parser.getNumber () ) ; 
} else { 
System.out.printf ("Invalid entry.\n") ; 
} 
} 


public enum State { 
S I, S_F, SM, S STOP 
423 } 


public class Parser { 


private boolean valid = false; 

private int number = 0; 

public boolean getValid() { 
return valid; 


} 


public int getNumber() { 
return number; 


} 


public boolean isDigit(char ch) { 
return ('0' <= ch) && (ch <= '9'); 


} 


public void parseNum(String line) { 
line = line + '\n'; 
int lineIndex = 0; 
char nextChar; 
int sign = +1; 
valid = true; 





图 7-29 用 直接 编码 技术 实现 图 7-20b A FSM 
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State state State.S_I; 
do { 
nextChar = line.charAt (lineIndex++); 
switch (state) { 
case S I: 

if (mextChar == '+') { 
sign = +1; 
state = State.S F; 

} else if (nextChar == '-') { 
sign = -1; 
state = State.S F; 

} else if (isDigit(nextChar)) { 
sign = +1; 
number = nextChar - '0'; 
state = State.S M; 424 

} else { 
valid = false; 

} 

break; 

case S F: 

if (isDigit(nextChar)) { 

number = nextChar - '0'; 


state = State.S M; 
} else { 


valid = false; 

} 

break; 

case S M: 

if (isDigit(nextChar)) { 
number = 10 * number + nextChar - '0'; 

} else if (mextChar == '\n') { 
number = sign * number; 
state = State.S STOP; 

} else { 
valid false; 

} 


break; 


} 


} while ((state != State.S STOP) && valid); 


} 
输入 /输出 


Enter a number: q 
Invalid entry. 


输入 /输出 
Enter a number: -58 
Number = -58 





图 7-29 (4) 
虽然 程序 显示 为 一 个 代码 清单 ， 但 它 实 际 上 来 自 三 个 不 同 的 文件 。 本 章 的 软件 遵循 每 个 
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类 一 个 文件 的 Java 编码 惯例 ， 且 文件 名 与 类 名 相同 。 比 如 ， 类 Parser 就 在 名 为 Parser.java 
的 独立 文件 中 ,类 State 也 在 一 个 独立 文件 中 。 

函数 parseNum() 把 换行 符 作为 标记 符号 ， 无 论 用 户 输入 多 少 个 字符 。 如 果 用 户 没有 在 
对 话 框 中 输入 字符 ， 而 只 是 按 下 了 Parse 按钮 ，parseNum() 就 会 把 换行 符 放 在 line[0]。 

这 个 过 程 有 一 个 局 部 枚 举 型 变量 state， 它 的 可 能 值 为 S IS F 或 $S M， 对 应 于 图 7-20b 
中 FSM 的 状态 I[、F 和 M。 另 外 ,还 有 一 个 状态 称 为 S STOP， 是 用 来 终止 循环 的 。 郴 数 把 
valid 初始 化 为 true， 把 state 初始 化 为 起 始 状 态 S_I。 

do 循环 模拟 有 限 状 态 机 中 的 转换 ， 使 用 直接 编码 技术 。switch 语句 确定 当前 状态 ,每 
PLP RRA 让 语句 确定 下 一 个 字符 ， 而 代码 中 的 赋值 语句 直接 改变 状态 变量 。 

在 简化 的 FSM 中 ， 有 两 种 方式 来 停止 程序 ， 要 么 输入 完 处 理 ， 要 么 到 达 了 一 个 状态 ， 
它 对 于 下 一 个 字符 没有 对 应 的 转换 。 在 后 一 种 情况 中 ， 输 入 字符 串 是 非法 的 。 对 应 于 这 两 种 
停止 条 件 ， 有 两 种 方式 来 退出 do 循环 : 当 到 达 输 入 标记 符号 且 当 前 状态 为 终止 状态 时 ， 或 
者 发 现 该 字符 串 是 非法 时 。 

do 循环 体 至 少 被 执行 一 次 。 即 使 被 按 下 的 是 Parse 键 且 文本 输入 字段 为 空 ， 该 代码 也 
会 正确 执行 。parseNum() 把 换行 符 放 在 line[0]， 将 state 初始 化 为 TI， 进 入 do 循环 ， 立 即 把 
nextChar 设置 为 换行 符 。 然 后 valid 置 为 false， 循 环 正确 终止 。 

除了 确定 输入 字符 串 是 否 合法 外 ，parseNum() 还 把 字符 串 转换 为 适当 的 整数 值 。 如 果 
第 一 个 字符 是 + 或 者 数字 ，sign 置 为 +L1。 如 果 第 一 个 符号 是 -，sign EA -lo 在 I 或 F 状 
态 中 检测 到 的 第 一 个 数字 会 把 number 设置 为 对 应 的 值 。 在 M 状态 ， 每 次 检测 到 后 续 的 数字 
时 ，number 的 值 会 适当 地 变化 。 如 果 循 环 结束 时 判定 是 一 个 合法 的 数字 ， 那 么 这 个 数值 会 
FEV), sign. 

计算 正确 的 整数 值 是 一 个 语义 行为 ， 而 状态 分 配 是 一 个 句法 行为 。 采 用 直接 编码 方式 能 
够 比较 容易 地 在 句法 处 理 中 加 入 语义 处 理 ， 因 为 在 句法 代码 中 有 明确 的 位 置 可 以 包含 需要 的 
语义 处 理 。 例 如 ， 在 状态 I 中 ， 如 果 字 符 为 -，sign 必须 设置 为 -1， 很 容易 确定 在 句法 代码 
中 的 哪个 位 置 放 和 人 这样 的 赋值 语句 。 

如 果 用 户 在 合法 的 数字 字符 串 前 加 上 了 一 些 空格 ， 那 么 FSM 会 认为 该 字符 串 非 法 。 接 
下 来 的 这 个 程序 会 展示 如 何 纠正 这 个 不 足 。 


7.3.4 输入 缓冲 区 类 


接 下 来 的 两 个 程序 使 用 同样 的 技术 从 输入 流 获取 字符 。 为 了 不 在 两 个 程序 中 重复 输入 处 
理 的 代码 ， 本 节 展 示 了 一 个 输入 缓冲 区 类 的 实现 ， 这 两 个 程序 都 可 以 使 用 。 这 个 类 的 实现 存 
储 在 一 个 名 为 InBuffer.java 的 单独 文件 中 。 图 7-30 给 出 了 这 个 输入 缓冲 区 的 实现 。 

正如 在 接 下 来 两 个 程序 中 展示 的 那样 ，FSM 函数 有 时 会 发 现 来 自 输 入 流 的 一 个 字符 终 
结 了 当前 的 token， 而 对 该 函数 接 下 来 的 调用 中 输入 流 还 会 需要 它 。 从 概念 上 说 ， 这 个 函 
数 必须 把 这 个 字符 退回 到 输入 流 ， 这 样 接 下 来 的 调用 才能 再 获取 到 它 。BackUpInput() 提 
供 了 对 缓冲 区 类 的 这 样 一 种 操作 。 虽 然 FSM 函数 需要 访问 来 自 输入 缓冲 区 的 字符 ,但 是 
它 并 不 直接 访问 缓冲 区 的 属性 。 只 有 过 程 getLine()、inputRemains()、advanceInput() 和 
backUpInput() 访问 缓冲 区 。 这 样 设计 的 目的 是 为 了 向 FSM 函数 提供 一 种 更 方便 的 输入 流 抽 
象 结构 。 


public class InBuffer { 


} 





private String inString; 
private String line; 
private int lineIndex; 


public InBuffer(String string) { 
inString = string + "\n\n"; 
// To guarantee inString.length() 


} 


== 0 eventually 


public void getLine() { 
int i = inString.indexOf('\n') ; 


line = inString.substring(0, i + 1); 


inString = inString.substring(i + 1); 
lineIndex = 0; 


} 


public boolean inputRemains() { 
return inString.length() != 0; 


} 


public char advanceInput() { 
return line.charAt (lineIndex++) ; 


} 


public void backUpInput() { 
lineIndex--; 


} 


图 7-30 FA 7-32 Ail 7-35 程序 包含 的 输入 缓冲 区 类 


本 章 其 余 的 两 个 程序 使 用 了 多 行 输入 。 缓 冲 区 的 构造 函数 添加 了 两 个 换行 符 到 输入 
string， 并 把 结果 存储 到 inString。 行 由 换行 符 \n HEAT I. PRL getline() 从 inString 中 删 
除 第 一 行 ， 用 换行 符 做 分 隔 符 并 将 其 放 和 信 line。 在 开始 的 地 方 加 入 两 个 换行 符 可 以 保证 从 
inString 中 删除 的 最 后 一 行 长 度 为 0。 


735 多 语言 符号 分 析 器 字母 
如 果 C 编译 器 的 语法 分 析 器 分 析 字 符 串 
数字 
total = 


它 知道 接 下 来 的 非 终结 符 会 是 像 amount 这 样 的 标 
识 符 或 者 像 100 这 样 的 整数 。 因 为 它 不 知道 接 下 
来 到 底 是 哪 种 语言 
示 的 、 能 够 识别 两 种 语言 符号 的 有 限 状 态 机 。 
标号 为 Ident 的 状态 是 识别 标识 符 语言 符号 的 
终止 状态 ，Int 是 识别 整数 的 终止 状态 。 从 Start 
到 Start 的 转换 接受 的 是 空格 符 ， 也 就 是 说 ， 人 允许 





符号 ， 所 以 它 调用 如 图 7-31 所 


数字 


图 7-31 识别 标识 符 和 整数 的 程序 的 FSM 


427 
2 
428 
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在 两 种 语言 符号 之 前 有 空格 。 如 果 剩 下 的 字符 是 行 尾 的 空格 符 ， 那么 FSM 过 程 会 返回 空 语 
言 符 号 ， 这 也 正 是 为 什么 起 始 状态 也 是 终止 状态 的 原因 。 
图 7-32 展示 了 一 个 实现 了 图 7-31 中 多 语言 符号 识别 器 的 程序 两 次 运行 的 输入 / 输出 。 
第 一 次 运行 有 两 行 输入 ， 第 一 行 是 5 个 非 空 语言 符号 ， 第 二 行 是 6 个 非 空 语言 符号 。 下 面 是 
对 图 7-32 中 第 一 次 运行 的 解释 。 
输入 


Here is A47 48B 
C-49 ALongIdentifier +50 D16-51 


输出 


Identifier 


输入 
Here is A47+ 48B 
C+49 


ALongIdentifier 


输出 


Identifier 


Here 
is 
A47 
48 

B 


Identifier 
Identifier Here 


Integer 


外 1 li 外 站 


Identifier = is 


Identifier Identifier A47 


Empty token 


Syntax error 
C Identifier = C 
-49 
ALongIdentifier 
50 
D16 
-51 


Identifier 
Integer Integer = 49 
Identifier Empty token 
Integer Empty token 


Identifier Identifier = ALongIdentifier 


li 1 il n W il 


Integer Empty token 





Empty token 
a) 第 一 次 运行 b) 第 二 次 运行 
图 7-32 识别 标识 符 和 整数 的 程序 的 输入 /输出 


状态 机 从 起 始 状 态 开 始 , 扫描 第 一 个 终结 符 百 ， 进 入 Ident 状态 。 接 下 来 的 终结 符 e、r 
和 e 都 继续 转换 到 同一 个 状态 。 接 下 来 的 终结 符 是 空格 ， 从 状态 Ident 没有 接受 终结 符 空格 
的 转换 。 因 为 当前 状态 机 是 在 标识 符 的 终止 状态 中 ， 所 以 得 出 扫描 到 一 个 标识 符 的 结论 。 因 
为 在 当前 这 个 状态 无 法 接受 终结 符 空格 ， 所 以 把 它 放 回 输入 ， 作 为 下 一 个 语言 符号 的 第 一 个 
终结 符 。 然 后 ,状态 机 声明 扫描 到 了 一 个 标识 符 。 

状态 机 重新 回 到 起 始 状 态 ， 用 刚刚 剩 下 的 空格 转换 到 Start。 更 多 的 空格 也 都 使 得 状态 
继续 转换 到 Start， 之 后 字符 i Al s 会 使 状态 机 识别 出 第 二 个 标识 符 ， 如 示例 输出 所 示 。 类 似 
地 ， 会 识别 出 A47 也 是 一 个 标识 符 。 

对 于 下 一 个 语言 符号 ， 初 始 的 4 使 得 状态 机 进入 Int 状态 ，8 使 得 转换 到 同一 个 状态 。 
现在 ， 状 态 机 的 输入 是 B， 从 状态 Int 没有 接受 终结 符 B 的 转换 。 因 为 当前 状态 机 是 在 整数 
的 终止 状态 中 ， 所 以 得 出 扫描 到 一 个 整数 的 结论 。 因 为 在 当前 这 个 状态 无 法 接受 终结 符 B， 
所 以 把 它 放 回 输入 ， 作 为 下 一 个 语言 符号 的 第 一 个 终结 符 。 然 后 ， 状 态 机 声明 扫描 到 了 一 个 
整数 。 而 在 下 一 轮 ，B 会 被 识别 为 一 个 标识 符 。 

状态 机 继续 识别 语言 符号 直到 到 达 行 尾 ， 此 时 它 识别 出 的 是 空 语言 符号 。 无 论 输 入 最 后 
有 没有 末尾 的 空格 ， 它 总 是 会 识别 到 空 语言 符号 ， 因 为 缓冲 区 添加 了 两 个 换行 符 到 输入 字 
FF FB 

第 二 个 输入 的 示例 展示 了 状态 机 如 何 处 理 包含 句法 错误 的 字符 串 。 在 识别 了 Here, is 
和 A47 之 后 ,在 下 一 次 调用 中 ,该 FSM 得 到 +， 然后 进入 Sin 状态 。 因 为 下 一 个 字符 是 空 
格 ，Sign 状态 没有 接受 空格 的 转换 ， 所 以 FSM 会 返回 非法 的 语言 符号 。 





7 HEME 285 


像 所 有 的 多 语言 符号 识别 器 一 样 ， 这 个 状态 机 按照 如 下 设计 原则 运行 : 

© 一 旦 进入 终止 状态 就 不 会 失败 。 如 果 该 终止 状态 没有 接受 刚刚 输入 的 终结 符 的 转换 ， 
就 是 识别 出 了 一 个 语言 符号 ， 退 回 最 后 一 个 输入 。 这 个 字符 会 作为 下 一 个 语言 符号 
的 第 一 个 非 终结 符 。 

这 个 状态 机 能 够 正确 处 理 一 个 空 行 (或 者 一 个 只 有 空格 的 行 )， 一 次 调用 就 会 返回 空 语 
言 符号 。 

图 7-33 是 语言 符号 类 结构 的 统一 建 模 语言 ( Unified Modeling Language, UML) 图 示 。 
AToken 是 一 个 抽象 的 语言 符号 ,没有 属性 ， 包 含 一 个 公共 的 抽象 操作 getDescriptopn()。 
操作 前 面 的 + 号 是 UML 中 公共 访问 的 标记 。 空 心 三 角 符号 是 UML 中 表示 继承 的 符号 。 
图 7-33 表明 实体 类 TEmpty, TInvalid, TInteger 和 Tidentifier 继承 自 AToken。UML 按 惯例 
把 抽象 类 名 和 方法 用 斜体 表示 。 














+ getDescription(): String 


ZN 
















TEmpty 
——————— 


Tinvalid 


Tinteger 
— intValue: int — stringValue: String 
+ Tinteger (i: int) + Tidentifier (StringBuffer: stringBuffer) 


图 7-33 AToken 类 结构 的 UML 图 示 


每 个 实体 类 必须 实现 它们 继承 自 超 类 的 抽象 方法 。 方 法 getDescriptopn() 为 图 7-32 所 示 
的 输出 返回 一 个 字符 串 。 除 了 继承 的 方法 ， 类 TInteger 还 有 一 个 私有 属性 intValue， 它 存储 
语法 分 析 器 识别 的 整数 值 ， 还 有 一 个 公共 的 构造 函数 。 属 性 前 面 的 - 号 是 UML 中 私有 访问 
的 符号 。 类 似 地 ， 类 TIdentifier 也 有 一 个 类 型 为 String 的 私有 属性 和 自己 的 构造 函数 ， 其 构 
ia AAA StringBuffer 类 型 的 形 参 ， 它 是 Java 可 变 字 符 串 类 型 。 

图 7-34 展示 了 图 7-30 的 语言 符号 类 结构 对 应 的 Java 实现 。 它 是 5 个 不 同 的 文件 的 代码 
片段 集合 ， 为 了 节省 空间 ， 没 有 显示 @Override 注释 。 


Tidentifier 














abstract public class AToken { 
public abstract String getDescription(); 


} 


public class TEmpty extends AToken { 
public String getDescription() { 


return "Empty token"; 
} 
} 


public class TInvalid extends AToken { 
public String getDescription() { 
return "Syntax error"; 
} 
} 





图 7-34 图 7-33  AToken 类 的 Java 实现 
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public class TInteger extends AToken { 


private final int intValue; 
public TInteger (int i) { 
intValue = i; 
431 } 
public String getDescription() { 
return String.format ("Integer = ¢d", intValue); 


public class TIdentifier extends AToken { 
private final String stringValue; 
public TIdentifier(StringBuffer stringBuffer) { 
stringValue = new String(stringBuffer) ; 
} 
public String getDescription() { 
return String.format ("Identifier = %s", stringValue); 





图 7-34 (#8) 


图 7-35 是 图 7-31 所 示 FSM 的 直接 编码 实现 。 它 是 3 个 Java 类 文件 的 代码 片段 集合 。 
类 Tokenizer 的 构造 函数 把 b 设置 为 使 用 输入 字符 串 加 载 的 缓冲 区 。 方 法 getToken() 返回 一 
个 抽象 语言 符号 ， 其 动态 类 型 是 实体 类 TEmpty、TInvalid、TInteger 和 Tidentifier 中 的 一 个 。 


public class Util { 
public static boolean isDigit(char ch) {. 
return ('0' <= ch) && (ch <= '9'); 
} 
public static boolean isAlpha(char ch) { 
return (('a' <= ch) && (ch <= 'z') || ('A' <= ch) && (ch <= 'Z')); 


432 } 
public enum LexState { 
LS_START, LS IDENT, LS SIGN, LS INTEGER, LS STOP 


public class Tokenizer { 


private final InBuffer b; 
public Tokenizer(InBuffer inBuffer) { 
b = inBuffer; 
} 
public AToken getToken() { 
char nextChar; 
StringBuffer localStringValue = new StringBuffer("") ; 
int localIntValue = 0; 


int sign 





A 7-35 图 7-31 所 示 FSM 的 Java 实现 


PIF BEURRE 


AToken aToken = new TEmpty() ; 
LexState state = LexState.LS START; 
do { 
nextChar = b.advanceInput () ; 
switch (state) { 
case LS_ START: 
if (Util.isAlpha(nextChar)) { 
localStringValue.append(nextChar) ; 
state = LexState.LS IDENT; 
else if (nextChar == '-') { 
sign = -1; 
state = LexState.LS SIGN; 
else if (nextChar == '+') { 
sign = +1; 
state = LexState.LS SIGN; 
else if (Util.isDigit(nextChar)) { 
localIntValue = nextChar - '0'; 
state = LexState.LS INTEGER; 
else if (nextChar == '\n') { 
state = LexState.LS STOP; 
else if (nextChar != ' ') { 
aToken = new TInvalid(); 
} 


break; 
case LS_IDENT: 

if (Util.isAlpha(nextChar) ||, Util.isDigit(nextChar)) { 
localStringValue.append (nextChar) ; 

} else { 
b.backUpInput () ; 
aToken = new TiIdentifier (localStringValue) ; 
state = LexState.LS STOP; 


} 


break; 


case LS_SIGN: 
if (Util.isDigit (mextChar)) { 
localIntValue = nextChar - '0'; 
state = LexState.LS_ INTEGER; 
} else { 
aToken = new TInvalid(); 
} 
break; 
case LS INTEGER: 
if (Util.isDigit (nextChar)) { 
localiIntValue = 10 * localIntValue + nextChar - '0'; 
} else { 
b.backUpInput () ; 
aToken = new TInteger (sign * localIntValue) ; 
state = LexState.LS_ STOP; 





图 7-35 (#2) 
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} 


break; 


} 


} while ((state != LexState.LS STOP) && !(aToken instanceof TInvalid)) ; 
return aToken; 
} 
} 





图 7-35 (BE) 


使 用 Java 类 StringBuffer() 来 提高 效率 。 方 法 getToken() 维护 一 个 可 变 的 局 部 字符 串 
值 ， 用 于 处 理 标识 符 。 方 法 append() 通过 添加 nextChar 来 改变 字符 串 。 比 把 nextChar 追加 
到 局 部 字符 串 值 的 副本 后 更 有 效率 。 

图 7-36 展示 了 函数 actionPerformed()。 该 函数 有 一 个 单一 的 抽象 语言 符号 ， 名 为 
aToken。 外 层 的 while 循环 对 每 一 行 输入 都 执行 一 次 ， 而 内 层 的 do 循环 对 一 行 中 的 每 个 语 
言 符号 都 执行 一 次 。 输 出 依赖 于 多 态 分 派 来 显示 检测 出 来 的 语言 符号 。 也 就 是 说 ， 主 程序 不 
显 式 地 检测 语言 符号 的 动态 类 型 来 选择 如 何 输 出 它 的 值 ， 它 只 用 它 的 抽象 语言 符号 来 调用 
getDescription() 方法 。 


public void actionPerformed(ActionEvent event) { 
InBuffer inBuffer = new InBuffer(textArea.getText ()) ; 
Tokenizer t = new Tokenizer (inBuffer) ; 
AToken aToken; 
inBuffer.getLine() ; 
while (inBuffer.inputRemains()) { 
do { 
aToken = t.getToken(); 
System. out.println(aToken.getDescription()) ; 
} while (!(aToken instanceof TEmpty) && !(aToken instanceof TInvalid)) ; 
inBuffer.getLine() ; 


} 





} 


图 7-36 图 7-35 所 示 语 言 符号 识别 器 的 actionPerformed() 方法 


7.4 代码 生成 

翻译 是 把 某 种 输入 字符 表 的 字符 串 变 换 为 某 种 输出 字符 表 的 字符 串 。 这 种 翻译 的 典型 阶 
段 是 词法 分 析 、 语 法 分 析 和 代码 生成 。 本 节 包 括 一 个 程序 ， 它 把 一 种 语言 翻译 成 男 一 种 ， 用 
以 说 明 一 个 简单 自动 翻译 器 的 所 有 3 个 阶段 。 


7.4.1 语言 翻译 器 

图 7-37 展示 了 翻译 器 的 输入 /输出 ,输入 是 源 代码 ， 输 出 是 目标 代码 和 格式 化 的 程序 
代码 清单 。 源 语言 和 目标 语言 都 是 面向 行 的 ， 汇 编 语言 也 是 如 此 。 

源 语 言 的 句法 包括 C 函数 调用 ， 目 标语 言 赋值 语句 的 句法 是 使 用 赋值 运算 符 <-。 输 入 
语言 的 一 个 语句 示例 是 


set (Time, 15) 
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对 应 的 目标 语句 是 


Time <- 15 


(Time, 15) 
( Accel, 3) 
(TSquared : Time) 
MUL ( TSquared, Time) 
( Position, TSquared) 
(Position, Accel) 

dIV (Position, 2) 

stop 

end 


输出 


Object code: 


(Alpha,, 123) 
(Alpha) 
(Alpha, 123) 
(Alpha) 
(Alpha, Beta 
(123, Alpha) 
(Alpha, Beta) 
(Alpha, 123) x 


Time <- 15 

Accel <- 

TSquared Time 

TSquared TSquared * Time 
Position TSquared 
Position Position * Accel 
Position Position / 2 
stop 9 errors were detected. 


Program listing: 
Program listing: iad a 


(Time, 15) 
(Accel, 3) 
(TSquared, Time) 
(TSquared, Time) 


ERROR: Second argument not an identifier or integer. 
ERROR: Comma expected after first argument. 

ERROR: Line must begin with function identifier. 
ERROR: Left parenthesis expected after function. 
ERROR: Right parenthesis expected after argument. 
ERROR: First argument not an identifier. 

ERROR: Right parenthesis expected after argument. 
ERROR: Illegal trailing character. 


(Position, TSquared) 


(Position, Accel) 
(Position, 2) 


ERROR: Missing "end" sentinel. 
a) 第 一 次 运行 b) 第 二 次 运行 
7-37 ”从 一 种 语言 到 另 一 种 语言 翻译 程序 的 输入 /输出 





字 set 是 源 语言 的 保留 字 ， 其 他 保留 字 包 括 add, sub, mul, div, neg, abs 和 end. 
Time 是 用 户 定义 的 标识 符 。 标 识 符 的 定义 规则 与 C 语言 相同 。 例 如 前 面 例子 中 的 15， 语 法 
也 与 C 一 样 。 

set 过 程 有 两 个 参数 ， 通 过 逗号 隔 开 ， 用 圆 括号 括 起 来 。 第 一 个 参数 必须 是 标识 符 ， 而 
第 二 个 参数 可 以 是 标识 符 ， 也 可 以 是 整数 常量 。 

翻译 的 另 一 个 例子 是 


mul (TSquared, Time) 


它 的 目标 代码 写作 


TSquared <- TSquared * Time 


与 set 过 程 一 样 ，mnul 过 程 调用 的 第 一 个 参数 必须 是 标识 符 。 要 翻译 mul ie), BPR AE 
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必须 重复 它 的 第 一 个 参数 ， 它 出 现在 赋值 操作 符 的 两 边 。 

其 他 过 程 调用 类 似 ， 除 了 neg Mabs, 它们 只 有 一 个 参数 。 对 于 neg， 翻 译 器 在 赋值 运 
算 符 的 右边 用 短 横 线 作为 参数 的 前 级; 对 于 abs， 翻 译 器 用 一 对 竖 线 把 参数 包括 起 来 。 例 如 ， 
源 程 序 语句 

neg (Alpha) 

abs (Beta) 


被 翻译 成 

Alpha <- -Alpha 

Beta <- |Beta| 

保留 字 end 是 翻译 器 的 标记 符号 ， 不 会 生成 任何 代码 ， 类 似 于 Pep/9 汇编 语言 
的 .END。 源 程序 行 中 可 以 出 现任 意 数量 的 空格 ， 但 是 标识 符 和 整数 中 不 能 有 空格 。 

如 果 输 入 程序 中 出 现 语 法 错误 ， 翻 译 器 不 一 定 裔 溃 。 在 图 7-37 中 ， 还 有 一 次 运行 中 ， 
源 文件 里 有 各 种 错误 。 程 序 产生 适当 的 错误 信息 帮助 用 户 找到 源 程序 中 的 问题 (bug)。 如 果 
翻译 器 检测 到 任何 错误 ， 就 会 阻止 输出 目标 代码 。 

这 个 程序 基于 句法 的 两 阶段 分 析 ， 如 图 7-27 所 示 。 不 过 没有 像 图 中 表明 的 那样 用 语法 
来 描述 分 析 问 题 ， 这 个 源 语言 的 结构 很 简单 ， 可 以 直接 基于 PSM 构造 分 析 器 。 

完整 的 翻译 器 Java 项 目 包含 26 个 类 和 26 个 关联 的 ,java 文件。 图 7-38 是 产生 图 7-37 
输出 程序 的 开始 部 分 代码 片段 。 程 序 代码 清单 会 继续 在 下 面 的 图 中 给 出 。 图 7-38 显示 了 翻 
译 器 使 用 的 3 个 Java 映射 的 设置 。 前 两 个 映射 中 ， 一 个 是 对 一 元 指令 的 ， 另 一 个 是 对 非 一 
元 指令 的 ， 用 保留 字 的 字符 串 表 示 作 为 关键 字 ， 返 回 枚 举 类 型 的 助 记 符 表示 。 第 三 个 表 用 枚 
举 类 型 的 助 记 符 值 作为 关键 字 查找 字符 串 符号 ， 并 放 到 生成 的 代码 中 。 这 些 映 射 使 用 源 代码 
保留 字 的 小 写字 符 串 表示 。 








public enum Mnemon { 
M_ADD, M_SUB, M MUL, M DIV, M NEG, M ABS, M SET, M_STOP,, M_END 


} 


public final class Maps { 










public static final Map<String, Mnemon> unaryMnemonTable; 
public static final Map<String, Mnemon> nonUnaryMnemonTable; 
public static final Map<Mnemon, String> mnemonStringTable; 





static { 
unaryMnemonTable = new HashMap<>() ; 

unaryMnemonTable.put("stop", Mnemon.M_ STOP) ; 
unaryMnemonTable.put ("end", Mnemon.M_END) ; 


nonUnaryMnemonTable = new HashMap<>() ; 









nonUnaryMnemonTable.put ("neg", Mnemon.M_NEG) ; 
nonUnaryMnemonTable.put ("abs", Mnemon.M_ABS) ; 
nonUnaryMnemonTable.put ("add", Mnemon.M_ADD) ; 
nonUnaryMnemonTable.put ("sub", Mnemon.M_SUB) ; 
Mnemon.M_MUL) ; 


图 7-38 翻译 器 程序 的 查找 映射 


nonUnaryMnemonTable.put ("mul", 
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nonUnaryMnemonTable.put ("div", Mnemon.M_DIV) ; 
nonUnaryMnemonTable.put ("set", Mnemon.M_SET) ; 


mnemonStringTable = new EnumMap<>(Mnemon.class) ; 
mnemonStringTable.put (Mnemon.M_ NEG, "neg"); 
mnemonStringTable.put (Mnemon.M ABS, "abs") ; 


mnemonStringTable.put (Mnemon.M_ADD, "add") ; 
mnemonStringTable.put (Mnemon.M_SUB, "sub") ; 
mnemonStringTable.put (Mnemon.M_ MUL, "mul") ; 
mnemonStringTable.put (Mnemon.M_DIV, "div"); 
mnemonStringTable.put (Mnemon.M_SET, "set") ; 
mnemonStringTable.put (Mnemon.M_STOP, "stop") ; 
mnemonStringTable.put (Mnemon.M_END, "end") ; 





图 7-38 (42) 


图 7-39 是 抽象 参数 的 UML 图 示 ， 而 图 7-40 是 其 Java 实现 。 因 为 源 代码 中 的 参数 
可 以 是 标识 符 ， 也 可 以 是 整数 ， 所 以 程序 中 有 一 个 通用 的 参数 AArg， 它 在 运行 时 可 以 是 
IdentArg 也 可 以 是 IntArg。 类 AArg 定义 了 一 个 抽象 的 方法 generateCode()， 当 必须 输出 参 
数值 时 ， 它 有 助 于 代码 生成 。 










+ generateCode(): String 
ZN 





图 7-39 类 结构 AArg 的 UML 图 示 


abstract public class AArg { 
abstract public String generateCode () ; 


public class IdentArg extends AArg { 
private final String identValue; 
public IdentArg(String str) { 
identValue = str; 
} 
public String generateCode() { 
return identValue; 


public class IntArg extends AArg { 
private final int intValue; 





图 7-40 图 7-39 中 类 AArg 的 Java 实现 
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public IntArg(int i) { 
intValue = i; 


} 


public String generateCode() { 
return String.format("%d", intValue) ; 


} 





图 7-40 ( 续 ) 
图 7-41 是 抽象 token 的 UML 图 示 ， 而 图 7-42 是 其 Java 实现 的 部 分 代码 清单 。TLeftParen、 
TRightParen, TEmpty 和 TInvalid 的 实现 与 TComma 的 实现 完全 相同 ， 它 们 都 没有 在 图 中 显示 。 
这 个 token 的 结构 类 似 于 前 一 节 中 图 7-33 中 的 token 结构 。 类 TIdentifier 和 TInteger 用 getter 方 


法 来 检索 它们 属性 的 值 。 
















Tidentifier 
— stringValue: String 


+ Tldentifier (stringBuffer: StringBuffer)| | + TInteger(i: int) 
getStringValue(): String + getintValue(): int 


图 7-41 类 结构 AToken 的 UML 图 示 







abstract public class AToken { 


} 


public class TIidentifier extends AToken { 
private final String stringValue; 
public TIdentifier(StringBuffer stringBuffer) { 
stringValue = new String(stringBuffer) ; 
} 
public String getStringValue() { 
return stringValue; 


} 


public class TInteger extends AToken { 
private final int intValue; 
public TInteger(int i) { 
intValue = i; 


} 


public int getIntValue() { 
return intValue; 


} 


public class TComma extends AToken { 


} 





图 7-42 图 7-41 中 类 AToken 的 Java 实现 
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当 词 法 分 析 器 遇 到 保留 字 和 参数 时 ， 它 返回 一 个 标识 符 。 当 它 遇 到 保留 字 时 ， 语 法 分 析 
器 需要 在 助 记 符 映射 中 查找 这 个 字 ， 用 getStringValue() 来 获取 token 的 标识 符 值 。 

图 7-43 是 抽象 代码 类 ACode 的 UML las, [Al 7-44 是 它 Java 实现 的 完整 代码 清单 。 
类 ACode 的 对 象 表示 一 行 源 代码 和 其 相应 的 目标 代码 。 执 行 方 法 generateCode() 返回 这 一 
行 的 目标 代码 的 字符 串 表示 ; 执行 genereateListing() 返回 这 一 行 的 格式 化 源 代码 的 字符 串 表 
示 。 所 以 ， 一 个 代码 对 象 必须 包含 输出 该 行 源 代 码 和 目标 代码 所 需 的 所 有 数据 。 


eae 


+ generateCode ( ): String 
+ generateListing ( ): String 












— errorMessage: String — mnemonic: Mnemon 
ee | 









TwoArginstr 


— mnemonic: Mnemon 
— firstArg: AArg 
—secondArg: AArg 


+ TwoArginstr (mn: Mnemon, fArg: AArg, sArg: AArg) 









/\ 












— identValue: String intValue: int 
+ IdentArg (str: String 


图 7-43 类 结构 ACode 的 UML 图 示 


abstract public class ACode { 
abstract public String generateCode() ;. 
abstract public String generateListing() ; 


} 


public class Error extends ACode { 
private final String errorMessage; 


public Error(String errMessage) { 


errorMessage = errMessage; 
public String generateListing() { 
return "ERROR: " + errorMessage + "\n"; 


} 





图 7-44 [Al 7-43 中 类 ACode 的 Java 实现 
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public String generateCode() { 
return ""; 


public class EmptyInstr extends ACode { 
// For an empty source line. 
public String generateListing() { 
return "\n"; 
} 
public String generateCode() { 
return Try 


public class UnaryInstr extends ACode { 
private final Mnemon mnemonic; 
public UnaryInstr(Mnemon mn) { 
mnemonic = mn; 


} 


public String generateListing() { 


return Maps.mnemonStringTable.get (mnemonic) + "\n"; 
} 
public String generateCode() { 
switch (mnemonic) { 
case M_STOP: 
return "stop\n"; 
case M END: 
return. "ny 
default: 


return ""; // Should not occur. 


public class OneArgInstr extends ACode { 
private final Mnemon mnemonic; 
private final AArg aArg; 
public OneArgInstr(Mnemon mn, AArg aArg) { 
mnemonic = mn; 
this.aArg = aArg; 
} 
public String generateListing() { 
return String.format("%s (%s)\n", 
Maps .mnemonStringTable.get (mnemonic), 
aArg.generateCode()); 
} 
public String generateCode() { 
switch (mnemonic) { 
case M_ABS: 


return String.format("%s <- |%s|\n", 


图 7-44 (4) 
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aArg.generateCode(), 
aArg.generateCode()) ; 
case M_NEG: 
return String.format("%s <- -%s\n", 
aArg.generateCode(), 
aArg.generateCode ()) ; 
default: 
return ""; // Should not occur. 


public class TwoArgInstr extends ACode { 
private final Mnemon mnemonic; 
private final AArg firstArg; 
private final AArg secondArg; 
public TwoArgInstr(Mnemon mn, AArg fArg, AArg sArg) { 
mnemonic = mn; 
firstaArg fArg; 
secondArg = sArg; 
} 
public String generateListing() { 
return String.format("%s (%s, %s)\n", 
Maps.mnemonStringTable.get (mnemonic), 
firstArg.generateCode(), 
secondArg.generateCode() ) ; 


} 


public String generateCode() { 


switch (mnemonic) { 
case M_SET: 
return String.format("%s <- %s\n", 


firstArg.generateCode(), 
secondArg.generateCode() ) ; 
case M ADD: 
return String.format("%s <- %s + %s\n", 
firstArg.generateCode(), 
firstArg.generateCode(), 
secondArg.generateCode () ) ; 
case M_SUB: 
return String.format("%s <- %s - %s\n", 
firstArg.generateCode(), 
firstArg.generateCode(), 
secondArg.generateCode()) ; 
case M MUL: 
return String.format("%s <- %s * %s\n", 
firstArg.generateCode(), 
firstArg.generateCode(), 
secondArg.generateCode()) ; 
case M_DIV: 
return String.. format ("%s <- %s / %s\n",, 





图 7-44 (4) 
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firstArg.generateCode(), 


firstArg.generateCode(), 
secondArg.generateCode() ) ; 
default: 
return ""; // Should not occur. 





图 7-44 (#2) 


例如 ， 图 7-43 展示 了 类 TwoArgInstr 的 一 个 对 象 ， 它 有 两 个 属性 firstArg 和 secondArg, 
两 者 都 是 抽象 参数 。 除 此 之 外 ， 该 对 象 还 有 一 个 枚 举 类 型 的 mnemonic。 考 虑 图 7-37a 的 最 
后 一 行 输入 

dIV (Position, 2) 


这 个 代码 对 象 的 mnemonic 4 F M_DIV, firstArg 是 一 个 identValue 等 于 “Position” 的 
IdentArg，secondArg 是 一 个 intValue 等 于 2 的 IntArg。 
实体 代码 类 包含 生成 目标 代码 清单 和 格式 化 源 代码 清单 的 方法 。 对 于 前 面 的 源 代码 
行 ， 翻 译 器 在 语法 分 析 阶 段 生 成 类 TwoArgInstr 的 一 个 对 象 ， 按 照 前 面 描述 的 设置 属性 
mnemonic, firstArg 和 secondArg。generateListing() 中 的 如 下 代码 返回 格式 化 代码 清单 的 
FAT 
public String generateListing() { 
return String.format("%s (%s, %s)\n", 
Maps .mnemonStringTable.get (mnemonic), 
firstArg.generateCode(), 


secondArg.generateCode () ) ; 


} 


EH mnemonic 作为 映射 的 关键 字 ， 查 找 保留 字 div 的 字符 串 表 示 。 然 后 ， 为 第 一 个 和 
第 二 个 参数 调用 generateCode()， 并 在 括号 内 对 它们 格式 化 。 结 果 是 字符 串 


div (Position, 2) 


被 格式 化 为 标准 样式 。 
generateCode() 中 的 如 下 代码 返回 目标 代码 的 字符 串 : 


case M MUL: 
return String.format ("%s <- %s * %s\n", 
firstArg.generateCode(), 
firstArg.generateCode(), 
secondArg.generateCode() ) ; 


结果 是 字符 串 


Position <- Position / 2 


第 一 个 参数 在 目标 代码 中 出 现 了 两 次 ， 一 次 在 赋值 运算 符 的 左边 ， 一 次 在 右边 。 

表示 类 合成 的 UML 符号 是 实心 菱形 ， 在 图 7-43 中 OneArgInstr 类 的 方 框 和 TwoArgInstr 
类 的 方 框 下面 。 类 合成 的 含义 是 “有 一 个 "， 区 别 于 继承 的 含义 “是 一 个 " 。OneArgInstr 对 象 
“是 一 个 ”ACode 对 象 ， 而 OneArgInstr 对 象 “ 有 一 个 ”AArg 对 象 。 
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图 7-45 是 词法 分 析 器 的 一 部 分 代码 清单 。 除 了 能 够 识别 图 7-41 所 示 的 7 种 token 之 外 ， 
函数 getToken 与 图 7-35 中 的 getToken 函数 类 似 。 和 前 面 一 样 ，aToken 是 由 函数 返回 的 抽 
象 token， 它 的 动态 类 型 可 以 是 aToken 的 7 个 实体 子 类 中 的 任何 一 个 。 


public enum LexState { 
LS_START, LS IDENT, LS_SIGN, LS INTEGER, LS_STOP 


public class Tokenizer { 
private final InBuffer b; 
public Tokenizer (InBuffer inBuffer) { 
b = inBuffer; 


public class Tokenizer { 
private final InBuffer b; 


public Tokenizer(InBuffer inBuffer) { 


b = inBuffer; 
} 
public AToken getToken() { 
char nextChar; 
StringBuffer localStringValue = new StringBuffer("") ; 
int localIntValue = 0; 
int sign = +1; 
AToken aToken = new TEmpty() ; 
LexState state = LexState.LS START; 
do { 
nextChar = b.advanceInput () ; 
switch (state) { 
case LS START: 
if (Util.isAlpha(nextChar)) { 
localStringValue.append (nextChar) ; 
state = LexState.LS_ IDENT; 
} else if (nextChar == '-') { 


case LS INTEGER: 
if (Util.isDigit (mextChar)) { 
localIntValue = 10 * localIntValue + nextChar - '0'; 
} else { 
b.backUpInput () ; 
aToken = new TInteger(localiIntValue) ; 
State = LexState.LS STOP; 
} 
break; 
} 
} while ((state != LexState.LS STOP) && !(aToken instanceof TInvalid)); 
return aToken; 





图 7-45 词法 分 析 器 


7-46 展示 了 一 个 描述 源 语言 的 确定 性 的 FSM。 该 状态 机 的 转换 接受 来 自 词 法 分 析 器 
的 token， 即 图 7-41 中 以 工 开 头 的 字 。 终 止 状态 PS_FINISH 只 能 通过 输入 token T EMPTY 
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才能 到 达 。 如 果 输 入 行 是 空白 行 或 该 行 上 只 含有 空格 ， 那 么 就 会 从 PS_START 转换 到 PS_ 
FINISH。 终 结 符 字 符 串 end 和 stop 是 仅 有 的 两 个 使 得 状态 从 PS_START 转换 到 PS_UNARY 
的 标识 符 。 对 应 于 其 他 保留 字 (set、add、sub 、mul、div 、neg 和 abs) 的 标识 符 使 得 状态 从 
PS_START 转换 到 PS_FUNCTION。 在 PS_START 状态 下 检测 到 所 有 其 他 的 标识 符 都 是 非 


法 的 。 


T_IDENTIFIER1 






PS_ START 


T IDENTIFIER? 


PS_FUNCTION 


T_LEFT PAREN 













T_EMPTY 






T_IDENTIFIER 


PS_1ST_OPRND 
4 


T_COMMA 


3 








T_RIGHT_PAREN T_EMPTY 












PS _NON_UNARY1 PS FINISH 


T_EMPTY 


PS _NON_UNARY2 


T IDENTIFIER 
T_INTEGER 


PS_2ND_OPRND 


备注 1: 仅 标识 符 stop 和 end. 

备注 2: 仅 标 识 符 set, add, sub, mul, div, neg fil abs. 
备注 3: 仅 对 助 记 符 M_NEG FI M_ABS, 

备注 4; 仅 对 助 记 符 M_sET、M ADD、M SUB 和 M MUL、 M_DIV. 


图 7-46 图 7-47 的 语法 分 析 器 processSourceLine 的 FSM 
图 7-47 是 实现 图 7-46 中 FSM 的 部 分 翻译 器 代码 清单 。 类 Translator 有 两 个 方法 ， 私 


有 方法 parseLine() 和 公有 方法 translate()， 公 有 方法 在 每 个 源 代码 行 执行 一 次 的 循环 中 调用 
parseLine(). 





T_RIGHT_PAREN 





public enum ParseState { 


PS START, PS UNARY, PS FUNCTION, PS_OPEN, PS_1ST_OPRND, PS _NONUNARY1, 
PS COMMA, PS _2ND OPRND, PS NON UNARY2, PS FINISH 


} 


public class Translator { 
private final InBuffer b; 
private Tokenizer t; 
private ACode aCode; 
public Translator(InBuffer inBuffer) { 





图 7-47 实现 图 7-46 中 FSM 的 部 分 翻译 器 代码 清单 
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inBuffer; 


// Sets aCode and returns boolean true if end statement is processed. 
private boolean parseline() { 
boolean terminate = false; 
AArg localFirstArg = new IntArg(0) ; 
AArg localSecondArg; 
Mnemon localMnemon = Mnemon.M END; // Useless initialization 
AToken aToken; 
aCode = new EmptyInstr(); 
ParseState state = ParseState.PS START; 
do { 
aToken = t.getToken() ; 
switch (state) { 
case PS START: 
if (aToken instanceof TIdentifier) { 
TIdentifier localTIdentifier = (TIdentifier) aToken; 
String tempStr = localTIdentifier.getStringValue() ; 
if (Maps.unaryMnemonTable.containsKey ( 
tempStr.toLowerCase())) { 
localMnemon = Maps.unaryMnemonTable.get ( 
tempStr.toLowerCase () ) ; 
aCode = new UnaryInstr(localMnemon) ; 
terminate = localMnemon == Mnemon.M_END; 
state = ParseState.PS UNARY; 
} else if (Maps.nonUnaryMnemonTable.containsKey ( 
tempStr.toLowerCase())) { 
localMnemon = Maps.nonUnaryMnemonTable.get ( 
tempStr.toLowerCase () ) ; 
state ParseState.PS FUNCTION; 
} else { 
aCode new Error ( 
"Line must begin with function identifier.") ; 
} 
} else if (aToken instanceof TEmpty) { 
aCode = new EmptyInstr(); 
state ParseState.PS FINISH; 
} else { 
aCode new Error ( 
"Line must begin with function identifier."); 


} 


break; 


case PS COMMA: 
if (aToken instanceof TIdentifier) { 
Tidentifier localTIidentifier = (TIdentifier) aToken; 
localSecondArg = new IdentArg( 
localTIidentifier.getStringValue() ) ; 
aCode = new TwoArgInstr ( 
localMnemon, localFirstArg, localSecondArg) ; 





图 7-47 (42) 
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state = ParseState.PS_2ND_OPRND; 
} else if (aToken instanceof TInteger) { 
TInteger localTInteger = (TInteger) aToken; 
localSecondArg = new IntArg( 
localTInteger.getIntValue()); 
aCode new TwoArgInstr ( 
localMnemon, localFirstArg, localSecondArg) ; 
state ParseState.PS 2ND_OPRND; 
} else { 
aCode new Error ( 


"Second argument not an identifier or integer."); 


} 


451 break; 


case PS NON _UNARY2: 
if (aToken instanceof TEmpty) { 
state = ParseState.PS FINISH; 
} else { 
aCode new Error ("Illegal trailing character.") ; 


} 
break; 
} 


} while (state != ParseState.PS FINISH && !(aCode instanceof Error) ) ; 
return terminate; 


public void translate() { 
ArrayList<ACode> codeTable = new ArrayList<>() ; 
int numErrors = 0; 
= new Tokenizer (b); 
boolean terminateWithEnd = false; 
b.getLine() ; 


while (b.inputRemains() && !terminateWithEnd) { 
terminateWithEnd = parseLine(); // Sets aCode and returns boolean. 
codeTable.add(aCode) ; 
if (aCode instanceof Error) { 


numErrors++; 


} 


b.getLine() ; 


(!terminateWithEnd) { 

aCode = new Error("Missing \"end\" sentinel.") ; 
codeTable.add(aCode) ; 

numErrors++; 


(numErrors == 0) { 
System.out.printf ("Object code:\n") ; 
for (int i = 0; i < codeTable.size(); i++) { 


System.out.printf("%s", codeTable.get (i) .generateCode()); 





Al 7-47 ( 续 ) 
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if (numErrors == 1) { 


System.out .printf ("One error was detected. \n"); 
} else if (numErrors > 1) { 
System.out.printf("%d errors were detected. \n", numErrors) ; 
} 
System.out.printf("\nProgram listing:\n"); 
for (int i = 0; i < codeTable.size(); i++) { 
System.out.printf("%s", codeTable.get (i) .generateListing()); 





Al 7-47 ( 续 ) 


translate() 的 第 一 行将 一 个 代码 表 实 例 化 为 一 个 抽象 代码 对 象 列表 。 它 维护 检测 到 的 
错误 数量 ， 实 例 化 token 识别 器 ， 为 其 构造 函数 传递 输入 缓冲 区 。 它 还 维护 一 个 初始 化 为 
false 的 布尔 标志 ， 当 检测 到 的 token 是 end 时 ， 这 个 标志 被 设置 为 true。 它 调用 缓冲 区 的 
getLine() 方法 来 获取 源 代码 的 第 一 行 。 为 了 重新 建立 循环 常量 ， 它 调用 getLine() 作为 循 
环 体 的 最 后 一 条 语句 。 只 要 输入 保持 在 缓冲 区 中 ， 且 布尔 标志 一 直 为 false， 循 环 就 会 继续 
执行 。 

while 循环 的 第 一 条 语句 调用 parseLine()， 它 在 检测 到 结束 token 时 返回 true。 作 为 副 
作用 ， 它 把 翻译 器 类 的 aCode 属性 设置 为 它 在 语法 分 析 中 构造 的 实体 代码 对 象 。translate() 
把 这 个 实体 代码 对 象 保存 到 它 的 代码 表 中 。 如 果 代 码 是 Error 对 象 ， 那 么 错误 数量 增 
加 。translate() 的 其 余 代 码 通 过 循环 遍历 代码 表 并 为 每 个 代码 对 象 调用 generateCode () 和 
generateListing () 来 输出 目标 代码 和 格式 化 的 源 代码 清单 。 

图 7-47 中 的 parseLine() 结构 与 图 7-45 中 的 getToken() 结构 是 一 样 的 ， 因 为 这 两 个 函数 
都 实现 了 一 个 FSM。 这 两 个 函数 都 有 一 个 名 为 state 的 状态 变量 ， 以 及 一 个 do 循环 ， 当 检 
测 到 标记 符号 或 发 生 错误 时 ， 循 环 终止 。getToken(0) 循环 的 第 一 条 语句 是 


nextChar = b.advanceInput () ; 


它 从 缓冲 区 中 取得 下 一 个 终结 符 。 词 法 分 析 器 的 这 个 循环 扫描 足够 多 的 终结 符 来 组 成 一 个 
token。parseLine() 的 第 一 条 语句 是 


aToken = t.getToken() ; 


它 获取 下 一 个 token。 语 法 分 析 器 的 这 个 循环 扫描 足够 多 的 token 来 组 成 一 个 源 代码 行 。 它 
和 词法 分 析 器 循环 做 了 同样 的 处 理 ， 但 具有 更 高 的 抽象 层次 。 词 法 分 析 器 的 非 终结 符 就 像 语 
法 分 析 器 的 终结 符 一 样 。 

图 7-47 显示 了 PS_START, PS_COMMA 和 PS NON_ UNARY2 情况 下 FSM 语法 分 析 
器 的 代码 片段 。 其 他 情况 的 代码 与 之 类 似 。 在 PS_START 情况 下 ， 语 法 分 析 器 期 望 的 是 一 
个 标识 符 或 一 个 空 token。 如 果 检 测 到 的 是 一 个 标识 符 ， 它 就 把 从 该 token 得 到 的 字符 串 作 
为 关键 字 ， 检 查 一 元 和 非 一 元 指令 的 映射 。 如 果 映 射 有 对 应 这 个 关键 字 的 条 目 ， 就 从 映射 中 
检索 相应 的 助 记 符 ， 并 将 这 个 助 记 符 存储 到 用 于 其 余 语法 分 析 的 局 部 变量 中 。 

如 果 检 测 到 一 元 指令 ， 则 有 实例 化 实体 代码 对 象 所 需要 的 全 部 信息 ， 通 过 语句 


aCode = new UnaryInstr(localMnemon) ; 
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赋 给 aCode。 这 就 是 前 面 说 过 的 副作用 。 如 果 检 测 到 M_END， 就 把 终结 标志 设置 为 true， 
最 终 终止 循环 。 

如 果 检 测 到 非 一 元 指令 ， 则 没有 实例 化 实体 代码 对 象 所 需要 的 全 部 信息 。 它 只 保存 局 部 
助 记 符 以 备 后 用 ， 并 用 直接 编码 技术 把 下 一 个 状态 设置 为 PS_ FUNCTION。 

在 PS_COMMA 情况 下 ， 语 法 分 析 器 检测 到 逗号 token， 并 等 待 第 二 个 参数 ， 该 参数 可 
以 是 标识 符 ， 也 可 以 是 整数 。 如 果 是 标识 符 ， 就 用 语句 

localSecondArg = new IdentArg( 

localTIdentifier.getStringValue() ) ; 

实例 化 一 个 新 的 第 二 个 参数 对 象 。 参 数 的 构造 函数 需要 一 个 字符 串 ， 这 个 字符 串 由 语法 分 析 
器 从 token 获得 。 语 法 分 析 器 之 前 已 经 用 同样 的 方法 实例 化 了 第 一 个 参数 。 现 在 ， 它 用 局 部 
助 记 符 和 两 个 参数 ， 通 过 语句 

aCode = new TwoArgInstr ( 

localMnemon, localFirstArg, localSecondArg) ; 

实例 化 代码 对 象 。 如 果 第 二 个 参数 是 整数 ， 则 代码 与 之 类 似 。 在 这 两 个 实例 中 ， 状 态 变量 都 
按照 图 7-46 的 FSM 设置 为 PS_ SECOND OPRND. 

图 7-48 是 调用 翻译 器 的 actionPerformed() 函数 的 完整 代码 。 这 个 函数 只 有 3 个 步骤 。 
第 一 条 语句 用 输入 对 话 框 中 用 户 输入 的 源 代码 字符 串 来 实例 化 输入 缓冲 区 。 第 二 条 语句 
实例 化 翻译 器 ， 向 其 构造 函数 传递 输入 缓冲 区 ， 以 便 访问 源 代码 。 第 三 条 语句 调用 空 函 数 
translate()。 

public void actionperformed (ActionEvent event) { 
InBuffer inBuffer = new InBuffer(textArea.getText ()); 


Translator tr = new Translator (inBuffer) ; 
tr.translate(); 





} 


7-48 产生 图 7-37 所 示 输 出 的 翻译 器 的 actionPerformed() 函数 


执行 自动 翻译 的 三 个 阶段 的 函数 分 别 是 : 

o 词法 分 析 器 : getToken() 

o 语法 分 析 髓 : processSourceLine() 

e 代码 生成 器 : generateCode() 

词法 分 析 器 把 来 自 输入 缓冲 区 的 终结 字符 流 作为 输入 ， 向 语法 分 析 器 提供 输出 生成 的 
token 流 。 翻 译 器 为 每 行 源 代码 调用 语法 分 析 器 ， 语 法 分 析 器 调用 词法 分 析 器 。 通 常 ， 语 法 
分 析 器 的 输出 和 代码 生成 器 的 输入 是 语法 分 析 器 的 词法 树 或 用 内 部 低级 语言 编写 的 源 程序 。 
而 在 这 个 翻译 器 中 ， 语 法 分 析 器 的 输出 和 代码 生成 器 的 输入 就 只 有 用 内 部 低级 语言 编写 的 源 
程序 。 这 个 低级 语言 是 保存 在 codeTable 中 的 代码 对 象 列 表 。 当 语法 分 析 完 成 后 ，translate() 
通过 遍历 代码 表 并 调用 每 个 代码 对 象 的 代码 生成 函数 来 生成 代码 。 


7.4.2 语法 分 析 器 特性 


可 以 不 用 图 7-46 中 的 FSM 来 定义 源 语言 的 句法 ， 而 用 语法 来 定义 。 这 里 ， 这 个 源 语 言 
的 形式 语法 结构 很 简单 。 例 如 ，set 语句 的 产生 式 规 则 为 


<set-statement> 一 set ( <identifter> , <argument> ) 
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再 用 一 条 产生 式 规则 把 这 里 的 <argument> (< 实 参 >) 定义 为 <identifier> (< 标识 符 >) 或 
<integer> (< 整数 >)。 与 C 中 不 同 的 是 ， 这 个 语法 不 能 包含 递归 定义 。 

因为 源 句 法 很 简单 ， 所 以 对 该 语言 的 语法 分 析 可 以 基于 确定 性 的 FSM。 但 是 ， 大 多 数 
编程 语言 的 语法 分 析 器 没有 这 么 简单 。 虽 然 词 法 分 析 器 通常 可 以 基于 有 限 状态 机 ,但 是 语法 
分 析 器 是 比较 少见 能 够 基于 FSM 的 ， 实 际 中 大 多 数 语言 太 复杂 ， 没 有 办 法 使 用 这 项 技术 。 

因为 一 个 真实 语法 的 产生 式 规则 总 是 会 包含 许多 递归 定义 ， 所 以 分 析 算 法 也 包含 递归 过 
程 以 反映 语法 的 递归 特性 。 这 样 的 算法 称 作 递归 下 降 分 析 器 (recursive descent parser) 

无 论 源 语言 的 复杂 度 或 者 翻译 器 的 分 析 技 术 如 何 ， 翻 译 程序 中 语法 分 析 器 与 词法 分 析 器 
的 关系 都 是 一 样 的 : 语法 分 析 器 的 抽象 层次 高 于 词法 分 析 器 。 词 法 分 析 器 扫描 字符 ， 识 别 
token 并 将 其 传递 给 语法 分 析 器 ; 语法 分 析 器 扫描 token， 生 成 句法 树 或 用 内 部 低级 语言 编写 
的 源 程序 。 代 码 生 成 器 用 句法 树 或 低级 翻译 来 生成 目标 代码 。 


本 章 小 结 


计算 机 科学 的 基本 问题 是 “什么 能 够 被 自动 化 ?” 人 工 语言 的 自动 化 翻译 是 计算 机 科学 
的 核心 。 每 种 人 工 语 言 都 有 一 个 符号 表 。 一 个 集合 的 闭 包 ，T* ， 是 连接 T 中 元 素 能 够 形成 
的 所 有 可 能 字符 串 的 集合 。 语 言 是 它 的 字符 表 闭 包 的 一 个 子 集 。 语 法 描述 语言 的 句法 ， 有 4 
个 部 分 : 一 个 非 终结 符 表 、 一 个 终结 符 表 、 一 组 产生 式 规则 和 一 个 起 始 符 号 。 推 导 是 语法 确 
定语 言 合 法 句子 的 过 程 。 为 了 推导 出 语言 的 一 个 句子 ， 要 从 起 始 符号 开始 ， 用 产生 式 规则 做 
替换 ， 直 到 得 到 一 个 终结 符 字符 串 。 语 法 分 析 问 题 是 确定 推导 序列 ， 使 之 与 一 个 给 定 的 终结 
符 字 符 串 匹配 。 标 准 C 语法 有 上 百 条 产生 式 规 则 。 上 下 文 无 关 语 法 是 限制 产生 式 规则 左边 
只 能 包含 一 个 非 终结 符 的 语法 。 虽 然 C 语 法 是 上 下 文 无 关 的 , 但 是 它 的 某 些 方面 是 上 下 文 
相关 的 。 

有 限 状 态 机 (FSM) 也 能 描述 语言 的 句法 ， 由 一 组 状态 和 状态 之 间 的 转换 组 成 。 每 个 转 
换 都 标明 有 一 个 输入 终结 符号 ， 有 一 个 状态 是 起 始 状态 ， 至 少 有 一 个 ， 也 可 能 有 多 个 终止 状 
态 。 非 确定 性 的 FSM 中 从 一 个 给 定 状态 对 于 一 个 输入 终结 符 ， 可 能 有 多 个 转换 。 如 果 从 起 
始 状态 出 发 ， 有 一 个 转换 序列 接受 句子 中 的 符号 ， 使 得 最 后 以 终止 状态 结束 ， 那 么 这 个 句子 
就 是 合法 的 。 

FSM 的 两 种 软件 实现 技术 是 查找 表 技 术 和 直接 编码 技术 。 两 种 技术 都 包含 由 状态 变量 
控制 的 循环 ， 这 个 状态 变量 会 被 初始 化 为 起 始 状态 。 循 环 的 每 次 执行 都 对 应 于 FSM 中 的 一 
次 转换 。 在 查找 表 技术 中 ， 转 换 是 由 一 个 二 维 转换 表 确定 的 ; 而 在 直接 编码 技术 中 ， 转 换 是 
由 循环 体内 的 选择 语句 指定 的 。 

自动 翻译 器 的 3 个 翻译 阶段 是 词法 分 析 器 、 语 法 分 析 器 和 代码 生成 器 。 词 法 分 析 器 的 
输入 是 源 程 序 的 终结 符 流 。 词 法 分 析 器 的 输出 ， 也 就 是 语法 分 析 器 的 输入 ， 是 token 流 。 语 
法 分 析 器 的 输出 ， 也 就 是 代码 生成 器 的 输入 ， 是 抽象 的 句法 树 或 用 内 部 低级 语言 编写 的 源 
程序 。 对 于 大 多 数 高 级 语言 来 说 ， 词 法 分 析 器 基于 FSM， 语 法 分 析 器 基于 上 下 文 无 关 语法 ， 
代码 产生 器 严重 依赖 于 目标 语言 的 特性 。 


练习 


7.1% 
*]. 计算 机 科学 的 基本 问题 是 什么 ? 
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2. 整数 加 法 运算 的 单位 元 是 什么 ? 布尔 数 的 OR 运算 的 单位 元 是 什么 ? 
3. 用 图 7-1 的 语法 推导 出 下 面 的 字符 串 ， 画 出 相应 的 句法 树 。 


*(a) abc123 (b) alb2c3 (c) a321bc 
4. 用 图 7-2 的 语法 推导 出 下 面 的 字符 串 ， 画 出 相应 的 句法 树 。 
*(a) -d (b) +ddd (c) d 
5. 用 图 7-3 的 语法 推导 出 下 面 的 字符 串 。 
*(a) abc (b) aabbcc 
6. 对 于 下 面 每 个 字符 串 ， 说 明 是 否 能 从 图 7-5 的 语法 规则 推导 出 来 。 如 果 可 以 ， 画 出 对 应 的 句法 树 : 
*(a)a+ (a) (b)a * (+a) (cha * (ata) 
(dda * (ata)*a (eva + (-a) (WCC Caeyys 


7. 对 于 图 7-8 的 语法 ， 画 出 <statement> (< 语句 >) 对 于 下 列 字 符 串 的 句法 树 ， 假 设 S1、S2、S3、 
S4, C1 和 C2 都 是 合法 的 <expression> (< 表达 式 >): 


*(a) (b) 
{ if ( CI) { if (C1) 
Si ; if ( C2 ) 
$2 ; Sl > 
} else 
$2 ; 
$3: 3 
} 
(c) (d) 
tas « Ck} { Sl ; 
IE i C2] while ( Cl ) 
Ši i { if (C2) 
else $2 ; 
§2 = 83 ; 
else } 
S3 ; } 
S4 ; 
} 


8. 对 于 图 7-8 的 语法 ， 画 出 <statement> (< 语句 >) 对 于 下 列 字符 串 的 句法 树 ， 假 设 alpha, beta 和 

gamma 都 是 合法 的 <identifier> (< 标识 符 >)，1 和 24 都 是 合法 的 <constant> (< 常数 >): 
*(a) alpha = 1 ; 

(b) alpha = alpha + 1 ; 

(c) alpha = (beta * 1) ; 

(d) alpha = ((beta + 1) * (gamma + 24)) ; 

(e) alpha (beta) ; 

(f) alpha (beta, 24) ; 

9. 对 于 图 7-8 的 语法 ， 画 出 <translatioin-unit> (< 翻译 单元 >) 对 于 下 列 字 符 串 的 句法 树 ， 假 设 alpha. 
beta gamma 和 main 都 是 合法 的 <identifier> (< 标识 符 >), C1.S1 和 S2 都 是 合法 的 <expression> (< 
表达 式 >): 
int main() 

{ int gamma; 
alpha (gamma) ; 
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if (C1) 
Sl; 
else 
S2; 
} 


10, 本 练习 提出 的 问题 是 “两 个 不 同 的 语法 能 产生 同一 种 语言 吗 ? ”图 7-49 和 图 7-50 中 的 语法 是 不 同 
的 ， 它 们 有 不 同 的 非 终结 符 集合 和 不 同 的 产生 式 规 则 。 用 这 两 种 语法 做 实验 ,推导 一 些 终结 符 字符 
串 。 通 过 你 的 实验 ， 描 述 这 两 种 语法 产生 的 语言 。 可 以 根据 图 7-49 的 语法 推导 出 而 用 图 7-50 的 语 
法 推导 不 出 来 的 合法 终结 符 字符 串 吗 ? 反 过 来 呢 ? 证 明 你 的 推测 。 


N={A,B} 
T={0,1} 
P= 产生 式 规则 


N={C} 
T={0,1} 
P= 产生 式 规则 


1.A 一 0B 
2.B 一 10B 1.C 一 C10 
2.C 一 0 


S=C 





S=A 
图 7-49 练习 10 的 语法 图 7-50 练习 10 的 另 一 种 语法 


7.29 

11. 对 于 图 7-51 给 出 的 每 个 状态 机 ， 
(1 ) 说 明 这 个 FSM 是 确定 性 的 还 是 非 确定 性 的 ， 
(2 ) 识别 出 所 有 不 可 达 的 状态 。 





图 7-51 练习 11 的 FSM 
12. 为 图 7-52 中 的 每 个 有 限 状 态 机 消除 空转 换 ， 得 到 等 价 的 状态 机 。 





图 7-52 ”练习 12 的 FSM 


13. 画 一 个 确定 性 的 FSM， 人 能够 识别 以 下 标准 指定 的 1 和 0 的 字符 串 。 每 个 FSM 拒绝 所 有 非 0 或 1 的 

字符 。 459 
* (a) 3 个 字符 的 字符 串 ，101。 

(b) 所 有 以 101 结尾 的 任意 长 度 的 字符 串 。 例 如 ， 该 FSM 应 该 能 够 接受 1101, 但 是 拒绝 1011。 

(c) 所 有 长 度 任意 以 101 开头 的 字符 串 。 例 如 ， 该 FSM 应 该 接受 1010, 但 是 拒绝 0101。 
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(d) 所 有 长 度 任意 且 至 少 包含 一 个 101 的 字符 串 。 例 如 ， 该 FSM 应 该 能 够 接受 (a)、(b) 和 (e) 中 
提 到 的 所 有 字符 串 ， 以 及 像 11100001011111100111 这 样 的 字符 串 。 
7.4% 
14. 设计 一 个 描述 图 7-47 中 翻译 器 的 源 语 言 的 语法 。 


编程 题 


7.3% 
15. 按照 本 书 所 建议 的 那样 ， 改 进 图 7-28 中 的 程序 ， 在 Alphabet 中 定义 第 三 个 枚 举 值 T_OTHER， 它 
表示 既 不 是 字母 又 不 是 数字 的 符号 。 
16. 用 图 7-28 中 程序 的 查找 表 技 术 实现 练习 13 中 的 每 个 FSM。 转 换 表 中 要 把 字符 区 分 为 B ONE、B_ 
ZERO 或 B_ OTHER。 
17. 用 图 7-29 中 程序 的 直接 编码 技术 实现 练习 13 中 的 每 个 FSM。 写 一 个 名 为 parsePat() 的 过 程 来 分 析 
对 应 于 parseNum() 的 模式 。 类 Parser 中 不 能 包含 属性 number 或 方法 getNumber()。 
18. 十 六 进 制 数字 是 '0…"9'、'a ff" 或 /ARF'。 一 个 十 六 进 制 常数 是 一 个 十 六 进 制 数字 序列 ， 例 如 3、 
a、0d 和 FF4e。 用 直接 编码 技术 实现 一 个 有 限 状 态 机 ， 就 像 图 7-29 中 的 一 样 ， 分 析 十 六 进 制 常数 ， 
并 把 它 转换 为 非 负 整数 。 输 入 /输出 应 该 与 图 7-29 类 似 ， 非 法 输入 会 产生 错误 消息 ， 合 法 十 六 进 
制 输入 字符 串 会 产生 非 负 整 数值 。 
7.4% 
19. 为 Pep/9 汇编 语言 写 一 个 汇编 器 。 按 照 列 出 的 顺序 实现 下 面 的 里 程 碑 节点 。 
(a) 用 方法 getToken() 编写 类 Tokenizer 来 实现 图 7-53 的 FSM。 使 用 图 7-30 中 的 类 InBuffer。 为 
每 个 具体 的 token 实现 方法 getDescription()， 并 用 图 7-36 中 actionPerformed() fit as WHE do 
循环 输出 token。 






十 六 进 制 数字 


图 7-53 习题 19 (a) 中 getToken 的 FSM 


(b) 


(c) 
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整数 存储 在 两 个 字 节 中 。 当 整数 被 认为 是 无 符号 数 时 ， 其 范围 为 0 ~ 65535; 当 被 认为 是 有 符 
号 数 时 ， 其 范围 为 -32 768 一 32 767。 你 的 程序 必须 接受 -32 768 ~ 65 535 范围 内 的 整数 ， 每 
次 扫描 一 个 十 进 制 数字 并 更 新 总 值 时 ， 都 要 在 这 个 范围 内 检查 。 如 果 输 入 的 十 进 制 数字 使 得 总 
值 超出 该 范围 ， 则 返回 非法 token。 

十 六 进 制 常量 也 存储 在 两 个 字 节 中 ， 但 是 是 无 符号 的 。 一 个 十 六 进 制 常量 的 最 大 值 为 65 535。 
每 次 扫描 一 个 十 六 进 制 数字 并 更 新 总 值 时 ， 检 查 其 十 进 制 数值 是 否 在 这 个 上 限 内 。 如 果 输 入 的 
十 六 进 制 数字 使 得 总 值 超过 该 上 限 ， 则 返回 非法 token。 每 次 扫描 十 六 进 制 数字 时 都 应 该 检查 
这 个 限制 。 不 要 检查 位 数 小 于 5 的 十 六 进 制 数字 ， 因 为 像 0x00F4B7 这 样 的 数 是 合法 的 。 

寻 址 方式 必须 与 标识 符 一 起 存储 在 Java String 属性 中 。 语 法 分 析 器 通过 查找 表 把 标识 符 转 换 为 
枚 举 类 型 。 

一 个 常见 的 错误 是 在 switch 语句 中 调用 advanceInput()。 请 确保 不 要 这 样 做 。advanceInput() 只 
能 在 一 个 地 方 被 调用 ， 那 就 是 do 循环 体 的 第 一 条 语句 。 

以 下 是 一 个 输入 /输出 示例 。 根据 FSM， 所 有 token 都 是 合法 的 。 例 如 ， 没 有 点 命令 beta, 也 
没有 寻 址 方式 cat。 但是， 相应 的 token 是 合法 的 ， 语 法 分 析 器 稍 后 在 翻译 中 检测 错误 。 


输入 
alpha .beta 
b7 Ox23ab ,SfX 
ii. y Gak 
-32768 65535 


输出 

Identifier = alpha 

Dot command = beta 

Empty token 

Identifier = b7 

Hexadecimal constant = 9131 
Addressing Mode = SfX 
Empty token 


Addressing Mode i 


Addressing Mode cat 


Empty token 
Integer = -32768 
Integer = 65535 
Empty token 


设计 对 应 于 图 7-46 Pep/9 语法 分 析 器 的 FSM 的 状态 转换 图 。 假 设 每 个 转换 接受 图 7-53 那些 
token 中 的 一 个 。 

本 项 目的 这 个 阶段 是 根据 (b) 的 FSM 编写 语法 分 析 器 。 完 成 的 代码 类 的 generateListing() 方 
法 ， 输 出 源 程序 的 格式 化 代码 清单 ， 而 不 是 目标 代码 。 你 的 程序 应 该 处 理 如 下 指令 : 

e 一 元 指令 : STOP, ASLA, ASRA 

e 非 一 元 指令 : BR, BRLT, BREQ, BRLE, CPWA, DECI, DECO, ADDA,SUBA, STWA, LDWA 
e 点 命令 : .BLOCK, .END 

e 常量 ; 十 进 制 ， 十 六 进 制 

设计 抽象 参数 AArg， 它 有 两 个 子 类 ， 分 别 对 应 于 十 六 进 制 常量 和 十 进 制 常量 ， 每 个 都 有 一 个 整 
型 属性 ， 类 似 于 图 7-40。 像 图 7-44 的 代码 类 那样 设计 你 的 抽象 代码 类 ACode。 非 一 元 助 记 符 
的 类 必须 有 其 指令 指示 符 的 抽象 参数 ， 以 及 其 寻 址 方式 的 寻 址 助 记 符 ， 寻 址 方式 必须 是 如 (a) 
说 明 的 枚 举 类 型 。 不 要 把 寻 址 方式 的 枚 举 类 型 与 其 他 枚 举 类 型 组 合 在 一 起 ， 它 们 必须 是 分 开 的 。 
设置 单独 的 Java 映射 来 查找 一 元 助 记 标 识 符 、 非 一 元 助 记 标识 符 、 点 命令 和 寻 址 方式 。 对 于 你 
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的 代码 类 ， 不 要 使 用 布尔 属性 来 区 分 一 元 和 非 一 元 指令 ， 相 反 ， 应 该 对 它们 使 用 不 同 的 类 。 
不 要 使 用 图 7-44 中 的 名 称 OneArgInstr 或 TwoArgInstr 来 描述 你 的 指令 。 在 Pep/9 汇编 语言 中 ， 
指令 既 可 以 是 一 元 也 可 以 是 非 一 元 的 。 不 要 使 用 图 中 名 称 firstArg 或 secondArg 来 描述 助 记 符 
之 后 的 条 目 。 对 于 非 一 元 指令 ， 助 记 符 之 后 的 条 目 是 操作 数 指示 符 和 寻 址 方式 。 

如 果 检 测 到 非法 寻 址 方式 或 其 他 错误 ， 就 必须 生成 错误 代码 对 象 来 处 理 错 误 。 比 如 ， 不 要 使 用 
非 一 元 代码 对 象 来 生成 任何 错误 消息 。 

当 在 Edit 菜单 中 选择 Format From Listing 时 ， 输 出 应 符合 Pep/9 汇编 器 的 标准 精细 打印 格式 。 
对 十 六 进 制 常 量 而 言 ，%X 格式 占 位 符 将 会 以 十 六 进 制 格式 输出 整数 值 。 查 阅 Java 文档 研究 
字段 宽度 和 前 导 零 选项 。 对 字符 串 而 言 ，%s 格式 占 位 符 可 以 在 用 空格 填充 的 字段 中 进行 左 对 
齐 或 右 对 齐 。 

完成 的 代码 类 的 generateCode() 方法 ， 以 适合 Pep/9 装载 器 的 格式 发 送 汇编 语言 程序 的 十 六 进 
制 目 标 代 码 。 以 下 是 一 个 输入 /输出 示例 。 你 的 代码 生成 器 应 该 为 每 一 行 源码 发 出 一 行 十 六 进 
制 对 ， 以 易于 直观 地 比较 目标 代码 与 源 代码 。 


输入 

BR 0x0007, i 

.BLOCK 4 

deci 0x2 ,d 

LDWA +2,d 

AdDa -5, i 

STWA 0x0004,d 
DECO 0x04,d 

STOP 

. END 


输出 
Object code: 
12 00 07 

00 00 00 00 
31 00 02 

Ci. 00 02 

60 FF FB 

E1 00 04 

39 00 04 

00 

ZZ 


Program listing: 


BR 0x0007 
-BLOCK 4 

DECI 0x0002,d 
LDWA 2,da 

ADDA “5,1 


STWA 0x0004,d 
DECO 0x0004,d 
STOP 
. END 


要 把 一 个 十 进 制 数 转换 为 十 六 进 制 ， 可 以 利用 一 个 事实 ， 即 n 右 移 8 位 就 得 到 /256。 利 用 它 
可 以 输出 整数 n 的 第 一 个 字 节 。 同 时 ，n%256 等 于 8 位 余数 ， 利 用 它 利用 输出 整数 的 第 二 个 
F 
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目标 代码 中 所 有 的 十 六 进 制 对 必须 用 且 只 用 一 个 空格 来 分 隔 。 目 标 代码 中 的 任何 行 都 不 能 在 行 
尾 包含 尾随 空格 ， 且 整个 序列 必须 用 小 写 的 zz 来 结束 。 测 试 你 的 目标 代码 :从 Java 控制 台 复 
制 十 六 进 制 代码 ， 将 其 粘贴 到 Pep/9 应 用 程序 的 目标 代码 窗 格 中 ， 然 后 执行 你 的 程序 。 

(e) 扩展 这 个 汇编 器 ， 包 括 Pep/9 指令 集中 所 有 40 条 指令 。 

(f) 扩展 这 个 汇编 器 ， 生 成 这 样 的 列表 ， 把 目标 代码 写 在 生成 它 的 源 代码 行 旁边 。 使 用 Pep/9 汇编 
器 标准 的 空格 规则 和 大 小 写 规则 输出 源 代码 行 。 

(g) 扩展 这 个 汇编 器 ， 人 允许 用 单 引号 扩 起 字符 常量 。 

(h) 扩展 这 个 汇编 器， 允许 点 命令 .WORD 和 .BYTE。 

(i) 扩展 这 个 汇编 器 ， 人 允许 点 命令 .ASCII， 字 符 串 用 双 引 号 括 起 来 。 

G) 扩展 这 个 汇编 器 ， 人 允许 源 代 码 行 包含 以 分 号 开始 的 注释 。 一 行 可 以 只 包含 一 条 注释 ， 也 可 以 一 
条 合法 指令 后 面 跟 一 条 注释 。 

(k) 扩展 这 个 汇编 器 ， 人 允许 使 用 符号 。 
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操作 系统 定义 了 一 个 比 ISA3 层 机 器 更 抽象 的 机 器 ， 更 容 
易 对 它 编程 。 其 目的 是 向 高 级 编程 语言 提供 一 个 更 加 方便 的 
环境 ， 并 更 有 效 地 分 配 系统 资源 。 操 作 系 统 层 位 于 汇编 层 和 
机 器 层 之 间 。 与 一 般 的 抽象 一 样 ， 操 作 系 统 向 更 高 层次 的 用 
户 隐藏 ISA3 层 机 器 的 细节 。 

典型 计算 机 系统 的 资源 包括 CPU 时 间 、 主 存 和 磁盘 存储 
器 。 本 章 讲 述 操作 系统 怎样 分 配 CPU 时 间 ， 接 下 来 的 第 9 章 
讲述 它 怎 样 分 配 主 存 和 磁盘 存储 器 。 

操作 系统 一 般 分 为 3 类 : 

e 单 用 户 

e 多 用 户 

e 实时 

智能 手机 和 平板 电脑 等 移动 设备 具有 单 用 户 操 作 系 统 ， 
这 样 的 计算 机 通常 是 由 单 人 拥有 并 操作 ,不 与 其 他 人 共享 。 
台式 机 和 笔记 本 电脑 具有 多 用 户 操作 系统 ， 可 以 为 多 人 设置 
个 人 用 户 账户 以 便 共享 计算 机 。 计 算 机 中 使 用 的 实时 系统 专 
门 用 于 控制 设备 ， 它 们 的 输入 来 自传 感 器 ， 输 出 是 给 设备 的 
控制 信号 。 例 如， 控制 汽车 发 动机 的 计算 机 使 用 的 就 是 实时 
系统 。 

Pep/9 操作 系统 是 一 个 单 用 户 操作 系统 ， 它 展示 了 分 配 
CPU 时 间 所 使 用 的 一 些 技术 ， 不 过 它 没有 说 明 主 存 和 磁盘 
存储 器 的 管理 。 本 章 的 前 两 节 包 含 了 Pep/9 操作 系统 的 完整 
代码 。 


8.1 装载 器 


操作 系统 的 一 个 重要 功能 是 管理 用 户 提交 的 待 执行 作业 。 
在 多 用 户 系统 中 ， 多 个 用 户 不 断 地 提交 作业 ， 操 作 系统 必须 
决定 运行 待 执行 作业 中 的 哪个 。 在 决定 接 下 来 执行 哪个 作业 
后 ， 它 必须 把 适当 的 程序 装载 到 主 存 并 把 CPU 的 控制 交 给 这 
个 程序 来 执行 。 


8.1.1 Pep/9 操作 系统 
图 8-1 展示 了 Pep/9 操作 系统 在 主 存 中 的 位 置 。 操 作 系 统 
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应 用 程序 
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FCOF 
系统 全 局 数据 
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FC16 
PCLT 


操作 系统 


FCS2 | 


Pep/9 的 内 存 映射 ， 
阴影 部 分 是 ROM 
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的 RAM 部 分 包括 了 第 一 个 字 节 被 分 配 在 FCOE 的 系统 栈 、 位 于 FCOF 到 FC14 的 系统 全 局 
数据 、 位 于 FC15 的 输入 设备 和 位 于 FC16 的 输出 设备 。 操 作 系统 的 ROM 部 分 如 图 中 阴影 
部 分 所 示 ， 包 括 了 位 于 FC17 的 装载 器 、 位 于 FC52 的 陷阱 处 理 程序 和 位 于 FFF4 到 FFFE 的 
6 个 机 器 向 量 。 虽 然 Pep/9 操作 系统 说 明了 装载 器 的 操作 ， 但 是 它 并 没有 说 明 操作 系统 决定 
运行 哪个 待 执行 作业 的 过 程 。 

本 章 讲述 的 是 Pep/9 操作 系统 ， 它 是 用 汇编 语言 编写 的 。 一 般 的 实现 都 是 高 级 语言 ( 通 
常 是 C) 和 汇编 语言 混合 写 的 ， 汇 编 语言 是 针对 该 操作 系统 控制 的 特定 计算 机 的 。 通 常情 况 
下 ， 系 统 的 95% 以 上 都 是 高 级 语言 写 的 ， 汇 编 语言 编写 的 不 到 5%。 汇 编 语言 部 分 保留 给 操 
作 系 统 中 需要 使 用 高 级 语言 所 没有 的 特性 编程 的 部 件 ， 或 者 那些 对 效率 有 额外 要 求 的 部 件 ， 
而 这 个 要 求 甚至 优化 编译 器 也 不 能 实现 。 

图 8-2 展示 了 Pep/9 操作 系统 的 全 局 常量 和 变量 。 符 号 TRUE 和 FALSE 用 .EQUATE 命 
令 声明 ,因此 不 会 生成 目标 代码 。 它 们 的 使 用 将 贯穿 程序 剩 下 的 部 分 。 


j****ee* Pep/9 Operating System, 2015/05/17 


TRUE: -EQUATE 1 
FALSE: -EQUATE 0 


;******* Operating system RAM 

osRAM: .BLOCK 128 ;System stack area 

wordTemp: .BLOCK 1 ;Temporary word storage 
byteTemp:.BLOCK 1 ;Least significant byte of wordTemp 
addrMask: . BLOCK ;Addressing mode mask 

opAddr: .BLOCK ;Trap instruction operand address 
charIn: .BLOCK ;Memory-mapped input device 


charOut: .BLOCK ;Memory-mapped output device 


j****e*ee* Operating system ROM 
. BURN OxFFFF 





图 8-2 Pep/9 操作 系统 的 全 局 常量 和 变量 


符号 osRAM, wordTemp, byteTemp, addrMask , opAddr, charIn 和 charOut 都 用 .BLOCK 
命令 来 定义 。 通 常情 况 下 ，.BLOCK 生成 代码 ， 且 所 有 生成 的 代码 都 从 0000 (hex) 开始 。 
从 代码 来 看 ， 这 些 BLOCK 没有 生成 代码 ， 且 osRAM 从 FB8F 而 不 是 0000 开始 。 

这 个 奇怪 的 汇编 器 行为 的 原因 在 于 FC17 的 ,BURN 命令 。 当 在 程序 中 含有 .BURN 时 ， 
汇编 器 会 假定 该 程序 将 烧 人 ROM， 它 会 为 跟 在 烧 入 指令 后 面 的 指令 生成 代码 ， 而 不 会 为 它 
前 面 的 指令 生成 代码 。 汇 编 器 同时 也 假设 ROM 的 最 后 一 个 字 节 被 安装 到 BURN 指令 指定 
的 地 址 ， 而 把 内 存 的 项 部 留 给 应 用 程序 使 用 。 因 此 它 计 算 符号 表 的 地 址 ， 使 得 生成 的 最 后 一 
个 字 节 的 地 址 是 烧 入 指令 指定 的 地 址 。 


在 这 段 代 码 中 ， 烧 入 指令 指出 最 后 一 个 字 节 应 该 在 地 址 FFFF 处 。 图 8-16 ( 见 8.2.9 节 ) 


显示 最 后 的 字 节 52 Chex) 确实 在 地 址 FFFF 处 ， 位 于 操作 系统 的 未 尾 。 因 为 FFFF (hex) 是 
65 535 (dec)， 所 以 Pep/9 计算 机 的 主 存 大 小 配置 为 64KiB。 可 以 修改 .BURN 指令 中 的 
值 来 改变 操作 系统 的 安装 地 址 ， 而 系统 仍然 能 正常 工作 。 比 如 ， 如 果 把 值 从 OxFFFF 改 为 
0x7FFF， 并 选择 汇编 和 安装 操作 系统 的 选项 ,那么 ，ROM 的 最 后 一 个 字 节 将 位 于 位 置 32Ki 
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减 1， 而 不 是 64Ki 减 1。 符 号 和 机 器 向 量 全 部 都 会 重新 计算 ， 系 统 仍 会 正常 运行 。 


8.1.2 Pep/9 装载 器 
图 8-3 展示 了 Pep/9 装载 器 。 要 调用 装载 器 ， 就 要 在 模拟 器 上 选择 装载 选项 ， 这 会 触发 


下 面 两 个 事件 : 


SP +— Mem[FFF6] 
PC +— Mem[FFFC] 
因为 Mem[FFF6] 包含 FCOF， 如 图 8-1 和 图 8-16 所 示 ， 所 以 栈 指 针 (SP) 被 初始 化 为 
472) FCOF。 类 似 地 ， 程 序 计数 器 (PC) 被 初始 化 为 FC17， 即 装载 器 第 一 条 指令 的 地 址 。 


C80000 


D1iFC15 
BOOO7A 
18FC51 
B00039 
14FC2C 
600009 
OA 

OA 

OA 
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F1FC10 
D1FC15 
B00039 
14FC3F 
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80000F 
91FCOF 
F50000 
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DIFC15 
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00 


装载 器 从 FC17 开始 ， 


j**eeee* System Loader 
;Data must be in the following format: 
;Each hex number representing a byte must contain exactly two 


;characters. 


Each character must be in 0..9, A..F, or a..f and 


¿must be followed by exactly one space. There must be no 


;leading spaces at the beginning of a line and no trailing 
;Spaces at the end of a line. The last two characters in the 
;file must be lowercase zz, which is used as the terminating 


;sentinel by the loader. 


loader: LDWX 
getChar: LDBA 
CPBA 
BREQ 
CPBA 


i 


stopLoad: 


0,i 


chariIn,d 
a ih 
stopLoad 
VON 5d 
shift 
Les 


byteTemp,d 
chariIn,d 
Oe H 
combine 
9,1 
Ox000F,i 
wordTemp,d 
0,x 

pe | 
charin,d 
getChar 





;X <= 0 


;Get first hex character 

;If end of file sentinel 'z' 

; then exit loader routine 

;If character <= '9', assume decimal 
; and right nybble is correct digit 
;else convert nybble to correct digit 
;Shift left by four bits to send 

; the digit to the most significant 
; position in the byte 


;Save the most significant nybble 
;Get second hex character 

;IE character <= '9', assume decimal 
; and right nybble is correct digit 
;else convert nybble to correct digit 
;Mask out the left nybble 

;Combine both hex digits in binary 
;Store in Mem[X] 

7X <- X +1 

;Skip blank or <LF> 


F 


图 8-3 Pep/9 操作 系统 的 装载 器 
将 变 址 寄存 器 清 零 ， 这 是 要 装载 的 第 一 个 字 节 的 地 址 。 从 FC1A 


到 FC42 的 代码 从 输入 流 获 取 接 下 来 的 两 个 十 六 进 制 字符 送 入 累加 器 的 低位 字 节 。 位 于 
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FC45 的 字 节 存储 累加 器 指令 把 字 节 装 人 内存 单元， 单元 地 址 由 变 址 寄存 器 指定 。 位 于 FC48 
的 增加 变 址 寄存 器 指令 把 变 址 寄存 器 加 1， 以 便装 人 下 一 个 字 节 。 

装载 器 是 一 个 单 循环 的 形式 ， 它 输入 一 个 字符 ， 将 它 和 标记 字符 z 进行 比较 。 如 果 该 字 
符 不 是 标记 字符 ， 那 么 程序 检查 它 是 和 否 属于 '0' ~ '9%'， 如 果 不 在 这 个 范围 内 ， 那么 最 右 的 4 
位 通过 加 9 转换 为 正确 的 值 。4 位 又 称 为 四 位 元 组 (nybble)， 是 半 字 节 。 注 意 ASCII 的 A 是 
0100 0001 (bin)， 因 此 它 加 上 9， 和 是 0100 1010， 最 右 的 半 字 节 是 十 六 进 制 数 A 的 正确 位 
模式 ， 十 六 进 制 的 B 到 下 也 是 类 似 的 情况 。 如 果 字 符 是 在 '0' ~ '9' 中 ,那么 最 右 半 字 节 已 经 
是 正确 的 值 了 。 

装载 器 把 半 字 节 4 位 移 到 左边 ， 临 时 存储 在 byteTemp 中 。 它 输入 第 二 个 字符 ， 类 似 地 
对 半 字 节 进 行 调 整 ， 用 FC3F 处 的 ANDA 和 FC42 处 的 ORA 把 两 个 半 字 节 合成 为 一 个 字 节 。 
可 惜 的 是 ，Pep/9 没有 字 节 AND 或 字 节 OR 指令 ， 所 以 ， 它 必须 使 用 这 些 操 作 的 字 版 本 。 
从 图 8-2 可 以 看 出 ，byteTemp 是 wordTemp 的 最 低 有 效 字 节 ， 这 也 就 是 为 什么 ORA 可 以 用 
wordTemp 访问 byteTemp。STOP 指令 会 终止 装载 器 ， 将 控制 返回 给 模拟 器 选项 。 

通常 要 装载 的 程序 不 是 十 六 进 制 ASCII 字 符 形 式 ， 它 们 已 经 是 二 进 制 形 式 ， 准 备 被 装 
载 了 。Pep/9 的 目标 文件 使 用 ASCII 字符 ， 因 此 可 以 直接 用 机 器 语言 编程 ， 用 文本 编辑 器 查 
看 目标 文件 。 


8.1.3 程序 的 终止 


到 目前 为 止 ， 所 有 出 现 的 应 用 程序 都 是 以 STOP 指令 终止 的 。 在 实际 的 计算 机 中 很 少 执 
ÍT STOP 指令 ，C 编译 器 不 会 在 程序 末尾 生成 一 个 STOP 指令 ， 而 是 生成 一 个 把 控制 返回 操 
作 系 统 的 指令 。 如 果 程 序 运行 在 一 台 个 人 计算 机 上 ， 那 么 操作 系统 会 设置 一 个 屏幕 ， 等 待 请 
求 男 一 个 服务 。 如 果 程 序 运 行 在 远程 分 时 共享 系统 上 ， 那 么 操作 系统 会 继续 处 理 其 他 用 户 的 
作业 。 无 论 哪 种 情况 ， 计 算 机 都 不 会 只 是 简单 地 停 下 来 。 

因为 仅 有 一 个 CPU， 所 以 它 在 执行 操作 系统 作业 和 应 用 作业 之 间 来 回 切换 。 图 8-4 展示 
了 当 操 作 系 统 装载 和 执行 一 系列 作业 时 CPU 使 用 的 时 间 线 ， 阴 影 部 分 代表 用 在 执行 操作 系 
统 上 的 时 间 。 





装载 器 fel 装载 器 作业 2 ”装载 器 
图 8-4” 当 操作 系统 加 载 和 执行 一 系列 作业 时 的 CPU 使 用 时 间 线 


操作 系统 代表 执行 业务 的 必要 的 开销 。 当 在 商场 购物 时 ， 购 买 商品 的 价格 不 只 是 反映 商 
品 的 生产 成 本 和 运输 到 商场 的 成 本 ， 也 反映 了 售货员 的 薪水 、 商 场 照明 的 电费 、 商 场 经 理 的 
附加 福利 等 。 类 似 地 ， 计 算 机 资源 并 不 是 100% 地 用 于 执行 用 户 的 程序 ， 一 部 分 资源 必须 保 
留 给 操作 系统 ， 目 前 我 们 考虑 的 资源 是 CPU 时 间 。 


8.2 陷阱 


当 在 Asmb5 层 用 汇编 语言 编程 时 ， 可 能 会 用 到 DECI、DECO 、HEXO 和 STRO 这 4 条 
指令 。 图 4-6 显示 了 在 ISA3 机 器 层 没 有 这 样 的 指令 ， 取 而 代 之 的 是 ， 当 计算 机 取出 具有 这 
样 一 些 操作 码 的 指令 时 ， 硬 件 会 执行 陷阱 。 陷 阱 类 似 于 子 例 程 转移 ， 但 是 要 更 复杂 一 些 。 执 
行 的 代码 称 为 陷阱 例 程 (trap routine) 或 者 陷阱 处 理 程序 (trap handler) 而 不 是 子 例 程 。 操 
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作 系 统 通过 执行 从 陷阱 返回 的 指令 RETTR 而 不 是 子 例 程 返回 的 指令 RET 将 控制 交 回 给 应 用 
程序 。 

陷阱 处 理 程序 实现 4 条 指令 ， 就 如 同 它们 是 ISA3 机 器 层 的 一 部 分 一 样 。 记 住 操 作 系 统 
的 目的 之 一 就 是 向 高 层 编程 提供 方便 的 环境 。Pep/9 操作 系统 提供 的 抽象 机 器 是 一 个 更 加 方 
便 的 机 器 ， 因 为 它 包 含 这 4 条 ISA3 层 没 有 的 指令 。 除 了 DECI, DECO, HEXO 和 STRO 外 ， 
操作 系统 还 提供 了 两 个 一 元 陷阱 指令 和 一 个 非 一 元 陷阱 指令 ， 叫 作 空 操作 ， 助 记 符 分 别 是 
NOPO, NOP1 和 NOP。 当 执行 这 些 指令 时 什么 都 不 做 ， 提 供 这 些 指 令 是 为 了 让 你 能 够 对 它 
们 重 编程 ， 执 行 你 自己 选择 的 新 指令 。 


8.2.1 陷阱 机 制 
下 面 是 陷阱 指令 的 寄存 器 传输 语言 (RTL) 描述 : 
Temp Mem[FFF6] ; 
Mem[Temp - 1] IR(O..7) ; 
Mem[Temp - 3] SP; 
Mem[Temp - 5] 


Mem[Temp - 7] 
Mem[Temp - 9] 
Mem[Temp — 10](4..7) 
SP 

PC 


Temp = 10; 
Mem|[FFFE] 

为 了 表述 方便 ，Temp 表示 临时 值 。Mem[FFF6] 包含 FCOF ， 即 系统 栈 的 地 址 。 在 第 一 
个 操作 中 ，Temp 获得 FCOF ， 接 下 来 的 6 个 操作 显示 CPU 把 所 有 寄存 器 的 内 容 都 压 人 系统 
Be, MIR 指令 指示 符 开始 ， 到 NZVC 标志 位 结束 。 接 着 栈 指针 被 修改 为 指向 新 的 系统 栈 顶 
部 ,程序 计数 器 获得 Mem[FFFE] 的 内 容 。 

图 8-5 展示 了 像 图 5-11 那样 的 陷阱 的 例子 。 图 5-11 中 的 程序 包含 下 面 的 十 进 制 输出 陷阱 : 


003E 390003 DECO 0x0003,d ;Output the sum 


这 里 的 003E 是 该 指令 的 地 址 ，390003 是 执行 中 触发 该 陷阱 的 目标 代码 。 


CPU Mem 


TET TTT TTT 
* 























a) 陷阱 执行 前 b) 陷阱 执行 后 
图 8-5 执行 DECO 陷阱 指令 390003 触发 的 陷阱 


图 8-5a 展示 了 陷阱 执行 前 CPU 的 状态 ， 图 8-5b 是 陷阱 执行 后 的 状态 。 可 以 看 到 只 有 
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IR 的 指令 指示 符 部 分 被 压 人 栈 ， 还 可 以 注意 到 4 个 NZVC 位 正好 位 于 Mem[FC05] 处 字 节 
的 右 半 部 分 ， 该 字 节 的 左 半 字 节 为 零 。SP 的 值 是 FC05， 即 新 系统 栈 的 顶部 ，PC 的 内 容 是 
Mem[FFFE]， 即 陷阱 处 理 程 序 第 一 条 指令 的 地 址 FC52。 图 8-16 (IL 8.2.9 节 ) 展示 了 操作 系 
统 怎 样 用 .ADDRSS 命令 在 地 址 FFF6 和 FFFE 设置 机 器 向 量 。 


8.2.2 RETTR 指令 


执行 时 的 程序 叫 作 进程 《process)。 陷 阱 机 制 临时 挂 起 一 个 进程 ， 这 样 操作 系统 可 以 执 
行 服务 。 主 存 中 包含 陷阱 进程 的 寄存 器 副本 的 信息 块 叫 作 进程 控制 块 (PCB)。 这 个 例子 的 
PCB 存储 在 Mem[FC05] 到 Mem[FCOE] 中 ， 如 图 8-5b 所 示 。 

操作 系统 执行 完 它 的 服务 后 ， 最 后 必须 把 CPU 的 控制 交 回 给 被 暂停 的 进程 ， 这 样 该 进 
程 可 以 继续 完成 执行 。 在 这 个 例子 中 ，Pep/9 操作 系统 执行 的 服务 是 执行 DECO 指令 。 操 作 
系统 通过 执行 陷阱 返回 指令 RETTR 将 控制 交 回 给 进程 。 

RETTR 的 RTL 描述 是 

NZVC < Mem[SP](4..7); 
A < Mem[SP +1]; 
X < Mem[SP +3]; 
PC < Mem[SP +5]; 
SP < MemI[SP + 7] 


RETTR 把 最 上 面 的 9 个 字 节 弹出 栈 放 入 NZVC, A, X, PC 和 SP 寄存 器 中 。 除 了 不 弹 
出 IR 外 ， 它 的 操作 顺序 刚好 和 陷阱 操作 的 顺序 相反 。 下 一 条 要 执行 的 指令 将 是 新 PC 的 值 
指定 的 指令 。 最 后 修改 的 寄存 器 是 SP。 

如 果 陷 阱 处 理 程序 不 修改 PCB 中 的 任何 值 ， 那 么 当 进程 恢复 时 ，RETTR 将 恢复 CPU FF 
存 器 的 原始 值 。 尤 其 是 SP， 就 像 在 处 理 陷 阱 时 一 样 ， 将 重新 指向 应 用 程序 栈 的 顶部 。 另 一 
方面 ， 陷 阱 处 理 程 序 对 PCB 中 值 的 任何 改变 ， 在 进程 恢复 时 ， 都 会 反映 在 CPU 寄存 器 中 。 


8.2.3 陷阱 处 理 程序 


图 8-6 展示 了 陷阱 处 理 程序 的 进入 点 和 退出 点 。oldIR 是 根据 陷阱 机 制 存 储 在 系统 栈 上 
的 IR 寄存 器 副本 的 栈 地 址 。 图 8-7a 展示 了 所 有 寄存 器 的 栈 地 址 。 


j¥exxkee Trap handler 
oldIR: .EQUATE 9 ;Stack address of IR on trap 


i 
DB0009 trap: LDBX oldIR,s ;X <- trapped IR 
B80028 CPBX 0x0028,i ;If X >= first nonunary trap opcode 
1CFC67 BRGE nonUnary ; trap opcode is nonunary 


880001 unary: ANDX 0x0001,i ;Mask out all but rightmost bit 
OB ASLX ;Two bytes per address 

25FC63 CALL unaryJT,x ;Call unary trap routine 

02 RETTR ;Return from trap 


FD6B unaryJT: .ADDRSS opcode26 ;Address of NOPO subroutine 
FD6C -ADDRSS opcode27 ;Address of NOP1 subroutine 





图 8-6 Pep/9 操作 系统 中 陷阱 处 理 程序 的 进入 点 和 退出 点 
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oD nonUnary : ASRX ;Trap opcode is nonunary 
oD ;Discard 
oD 

780005 ;Adjust so that NOP opcode 
OB ;Two bytes per address 
25FC72 ;Call nonunary trap routine 


addressing mode bits 


02 return: RETTR ;Return from trap 


FD6D nonUnJT: .ADDRSS opcode28 j;Address 
FD77 -ADDRSS opcode30 ;Address 
FEEB -ADDRSS opcode38 ;Address 
FF76 .RDDRSS opcode40 ;Address 
FFC2 -ADDRSS opcode48 ;Address 


图 8-6 (4) 





of NOP subroutine 

of DECI subroutine 
of DECO subroutine 
of HEXO subroutine 
of STRO subroutine 


当 执 行 一 条 陷阱 指令 时 ， 下 一 条 要 执行 的 指令 在 FC52， 即 图 8-6 中 的 第 一 条 指令 。 下 


面 任 何 一 条 指令 都 能 触发 陷阱 : 

0010 011n，NOPn， 一 元 空 操作 陷阱 

0010 1aaa，NOP， 非 一 元 空 操 作 陷 阱 

0011 0aaa，DECI， 非 一 元 十 进 制 输入 陷阱 

0011 laaa，DECO， 非 一 元 十 进 制 输出 陷阱 

0100 0aaa，HEXO， 非 一 元 十 六 进 制 输 出 陷阱 

0100 1aaa，STRO， 非 一 元 字符 串 输 出 陷阱 

图 8-6 中 的 代码 确定 哪 一 条 指令 触发 了 陷阱 ， 并 调用 
实现 这 条 指令 的 特定 处 理 程序 。 总 共有 7 个 陷阱 处 理 程 
序 ， 一 元 NOPn 指令 有 2 个 ， 非 一 元 指令 有 5 个 。 记 住 
VES + 诺 依 曼 循 环 的 取 指 部 分 是 把 指令 指示 符 放 在 指令 寄 
ras (IR) 中。 陷阱 发 生 后 ， 引 发 陷阱 的 指令 的 指令 指示 
符 可 以 从 系统 栈 上 获取 ， 因 为 根据 陷阱 机 制 ， 它 被 压 到 
TRE. Fl 8-6 中 的 代码 访问 被 保存 的 指令 指示 符 来 确定 
哪 一 条 指令 触发 了 该 陷阱 。 

在 图 8-6 中 第 一 条 指令 从 被 压 人 系统 栈 的 IR 副本 获 
取 操 作 码 。NOP 指令 有 第 一 个 非 一 元 操作 码 0010 laaa, 
H 0010 1000 (bin) 等 于 28 (hex)。 地 址 FC55 处 的 
CPBX 指令 将 陷阱 操作 码 和 28 (hex) 进行 比较 ， 如 果 陷 
阱 操作 码 小 于 28 (hex)， 那 么 该 陷阱 指令 是 一 元 的 ， 否 
则 是 非 一 元 的 。 


SP => 9 


won unwe 





a) 陷阱 发 生 后 


SP e—> 0 


一 





woe ON UU FN 


一 


b) 两 个 返回 地 址 在 运行 时 栈 中 ， 
阴影 部 分 是 PCB 


图 8-7 CPU 寄存 器 副本 的 栈 地 址 


如 果 陷 阱 指令 是 一 元 指令 ， 那 么 它 必定 是 下 列 两 条 指令 之 一 : 


0010 0110，NOP0， 最 右 位 是 0 
0010 0111，NOP1， 最 右 位 是 1 


地 址 FC5B 的 ANDX 指令 将 屏蔽 除了 最 右 位 外 的 所 有 位 ， 这 一 位 就 足以 确定 两 条 指令 
中 的 哪 条 引发 了 该 陷阱 。 地 址 FC5F 的 CALL 指令 使 用 图 6-40 中 程序 描述 的 采用 变 址 寻 址 的 
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转移 表 技术 。 图 6-40 展示 了 编译 器 怎样 用 无 条 件 分 支 指令 BR 和 地 址 数组 来 翻译 C 的 switch 
语句 。 图 8-6 的 代码 和 图 6-40 的 代码 稍 有 不 同 ， 因 为 它 使 用 了 CALL 而 不 是 BR， 但 原理 是 
一 样 的 。 地 址 FC63 的 转移 表 是 一 个 地 址 数组 ， 数 组 中 的 每 个 元 素 是 触发 该 陷阱 的 特定 指令 
的 陷阱 处 理 程序 的 第 一 条 语句 的 地 址 。 因 为 执行 CALL， 所 以 它 把 返回 地 址 压 入 栈 中 。 在 一 
个 特定 的 陷阱 处 理 程序 中 ， 最 后 执行 的 指令 是 RET， 它 将 控制 返回 到 FC62。 地 址 FC62 处 
的 指令 是 RETTR， 它 从 PCB 恢复 CPU 寄存 器 ， 把 控制 返回 该 陷阱 指令 后 面 的 那 条 指令 。 

对 所 有 的 非 一 元 指令 ， 从 FC67 到 FC7A 的 指令 做 一 样 的 事情 。3 个 ASRX 指令 丢弃 寻 
址 方式 位 ，SUBX 指令 进行 调整 ， 把 变 址 寄存 器 的 内 容 变 为 

0， 如 果 陷 阱 IR &4 0010 laaa, NOP 

1 ， 如 果 陷 阱 JR & 0011 0aaa，DECI 

2， 如 果 陷 阱 IR 包含 0011 laaa, DECO 

3, 如 果 陷 阱 IR 包含 0100 0aaa，HEXO 

4, 如 果 陷 阱 IR 包含 0100 laaa, STRO 

与 一 元 指令 一 样 ， 地 址 FC6E 处 的 CALL 会 分 支 到 某 条 特定 指令 的 陷阱 处 理 程序 。 陷 阱 
处 理 程序 执行 完 该 指令 后 ,会 把 控制 返回 到 地 址 FC71 处 的 RETTR 指令 ，RETTR 接着 把 控 
制 交 回 给 触发 该 陷阱 的 指令 后 面 的 那 条 指令 。 


8.2.4 陷阱 寻 址 方式 断言 

不 同 的 指令 有 不 同 的 寻 址 方式 。 例 如 ， 图 5-2 说 明 STWA 指令 不 能 用 立即 数 寻 址 ， 而 
STRO 指令 允许 用 直接 、 间 接 、 栈 相对 、 栈 相对 间接 和 变 址 寻 址 。 因 为 STWA 指令 是 固化 
到 CPU 中 的 ， 所 以 由 硬件 检测 是 否 发 生 了 寻 址 错误 。 但 是 陷阱 指令 如 STRO 不 是 CPU 原生 
的 ， 陷 阱 处 理 程序 用 软件 来 实现 它们 。 那 么 问题 来 了 ， 陷 阱 处 理 程序 怎样 检测 陷阱 指令 是 否 
试图 使 用 非法 的 寻 址 方式 呢 ? 答案 是 使 用 图 8-8 中 的 寻 址 方式 断言 例 程 。 


;***k*eee Assert valid trap addressing mode 

oldIR4: .EQUATE 13 ;OldIR + 4 with two return addresses 
D00001 assertAd:LDBA 1.2 jA <- 1 
DB000D LDBX oldIR4,s 7X <- O1dIR 
880007 ANDX 0x0007,i ;Keep only the addressing mode bits 
18FC8F BREQ testAd ;000 = immediate addressing 
OA loop: ASLA ;Shift the 1 bit left 
780001 Lyd ;Subtract from addressing mode count 
1AFC88 BRNE loop ;Try next addressing mode 
81FC11 testAd: addrMask,d ;AND the 1 bit with legal modes 
18FC96 addrErr 
01 ;Legal addressing mode, return 
DOOOOA addrErr: ‘Nn’, i 
F1FC16 charOut,d 


COFCA9 trapMsg,i ;Push address of error message 
E3FFFE -2,8 

580002 SUBSP Zieh ;Call print subroutine 

24FFDE CALL prntMsg 

00 STOP ;Halt: Fatal runtime error 
455252 trapMsg: .ASCII "ERROR: Invalid trap addressing mode.\x00" 





图 8-8 Pep/9 操作 系统 中 的 陷阱 寻 址 方式 断言 
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SALT RE E PFE Ai AE ERARE IR. MRR AES, IR 的 栈 地 址 是 9， 
如 图 8-7a 所 示 。 不 过 ， 到 调用 陷阱 寻 址 方式 断言 例 程 时 ， 系 统 栈 顶 又 增加 了 两 个 返回 地 址 ， 
一 个 地 址 来 自 图 8-6 的 陷阱 处 理 程序 代码 中 的 CALL 指令 ， 一 个 地 址 来 自 特定 陷阱 处 理 程序 
中 的 CALL。 图 8-7b 展示 了 寻 址 方式 断言 例 程 被 调用 后 系统 栈 上 的 PCB 和 栈 上 的 两 个 返回 
bhks KBF IR 的 栈 地 址 现在 是 13 而 不 是 9， 因为 两 个 返回 地 址 占用 了 4 字 节 。 

图 8-8 中 的 例 程 有 如 下 前 提 和 后 置 条 件 : 

o 前 提 条 件 : addrMask 是 位 掩 码 ， 表 示人 允许 的 寻 址 方式 集合 ， 陷 阱 指令 的 PCB 在 系统 

栈 上 。 

© 后 置 条 件 : 如 果 陷 阱 指令 的 寻 址 方式 在 允许 的 寻 址 方式 集合 中 ,那么 控制 就 交 回 给 

陷阱 处 理 程序 ， 否 则 输出 非法 寻 址 方式 信息 ， 程 序 中 止 于 致命 的 运行 时 错误 。 

寻 址 方式 断言 例 程 是 某 些 HOL6 语言 assert() 语句 的 Asmb5 WA. TECH, Bra HK 
的 功能 在 <assert.h> 库 中 ， 可 以 在 程序 中 用 #include 编译 器 伪 指令 包含 这 个 库 。 

陷阱 处 理 程序 使 用 断言 例 程 ， 首 先 如 图 8-2 中 地 址 FC11 所 示 设 置 全 局 变量 addrMask 
的 值 ， 使 之 表示 这 条 指令 允许 的 寻 址 方式 ， 接 着 如 图 8-8 中 地 址 FC7C 所 示 调 用 assertAd. 
断言 例 程 假定 使 用 一 种 称 为 位 图 表示 的 常用 的 集合 表示 法 。 在 机 器 语言 中 ， 每 位 的 值 为 0 或 
者 1。 人 允许 寻 址 方式 集合 的 位 图 表示 将 一 种 寻 址 方式 和 addrMask 中 的 一 位 对 应 ， 如 果 该 位 
是 0， 那 么 相对 应 的 寻 址 方式 就 不 在 集合 中 ， 如 果菜 位 的 值 为 1， 那 么 对 应 的 寻 址 方式 在 集 
合 中 。 

图 8-9 展示 了 STRO 指令 的 陷阱 处 理 程序 预先 设 
置 好 的 addrMask 的 最 右 一 个 字 节 ， 该 指令 允许 使 用 Danaanou 
直接 、 间 接 、 栈 相对 、 栈 相对 间接 和 变 址 寻 址 方式 。 
这 几 种 寻 址 方式 对 应 的 位 值 为 1， 其 他 位 为 0。 从 数 
学 上 说 ， 这 个 掩 码 代表 了 集合 { 直接 ， 间 接 ， 栈 相 


立即 数 
直接 


| 一 


对 ， 栈 相对 间接 ， 变 址 }。 ie 
为 了 说 明 图 8-8 中 的 断言 例 程 怎样 测试 集合 中 的 栈 相对 
成 员 ， 假 定 STRO 指令 用 栈 相 对 间接 寻 址 来 执行 ， 这 栈 相对 间接 

样 它 的 寻 址 aaa 字段 就 是 100， 这 是 被 允许 的 寻 址 方 变 址 

式 。 首 先 ， 地 址 FC7C 的 LDBA 语句 把 累加 器 的 最 右 栈 变 址 

一 个 字 节 置 为 0000 0001， 接 下 来 的 两 条 语句 根据 陷 栈 间接 变 址 
阱 指令 的 寻 址 aaa 字段 把 变 址 寄存 器 置 为 4(dec)。 然 图 8-9 与 STRO 陷阱 指令 允许 的 寻 
后 循环 从 4 开始 倒数 到 0， 每 次 循环 把 累加 器 中 的 那 址 方式 对 应 的 addrMask 位 


个 1 位 往 左 移动 一 位 ， 累 加 器 最 后 的 值 是 0001 0000, 

这 个 1 位 就 在 对 应 于 栈 相对 间接 寻 址 的 那个 位 置 。 地 址 FC8F 的 ANDA 语句 将 图 8-9 的 寻 
址 掩 码 与 累加 器 进行 AND 运算 ， 因 为 从 右 数 第 $ 位 的 值 是 1， 所 以 结果 为 非 零 ， 控 制 返回 
到 陷阱 处 理 程序 。 如 果 不 允 许 使 用 栈 相 对 间接 寻 址 ， 那 么 寻 址 掩 码 从 右 数 第 5 位 的 值 是 0， 
AND 运算 的 结果 是 0， 于 是 断言 失败 。 


8.2.5 ”陷阱 操作 数 地 址 计算 


陷阱 操作 数 地 址 计算 是 非 一 元 陷阱 处 理 程序 调用 的 另 一 个 例 程 。 原 生 指令 的 寻 址 方式 是 
固化 到 CPU 的 ， 但 是 陷阱 指令 以 软件 而 不 是 硬件 的 方式 实现 ， 因 此 必须 用 软件 方式 来 模拟 
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8 种 寻 址 方式 。 图 8-10 展示 了 执行 这 个 计算 的 例 程 。 


j eee Set address of trap operand 
oldx4: -EQUATE 7 ;oldX + 4 with two return addresses 
oldPC4: .EQUATE 9 ;OldPC + 4 with two return addresses 
oldSP4: „EQUATE 11 ;oldSP + 4 with two return addresses 
DBOOOD setAddr: LDBX oldIR4,s 7X <- old instruction register 
880007 ANDX 0x0007,i ;Keep only the addressing mode bits 
0B ASLX ;Two bytes per address 
13FCD8 BR addrJT,x 
FCE8 -ADDRSS addrI ;Immediate addressing 
FCF2 .ADDRSS addrD ;Direct addressing 
FCFF .ADDRSS addrN ;Indirect addressing 
FDOF .ADDRSS addrsS ;Stack-relative addressing 
FDIF -ADDRSS addrSF ;Stack-relative deferred addressing 
FD32 -ADDRSS addrxX ;Indexed addressing 
FD42 .ADDRSS addrSx ;Stack-indexed addressing 
FD55 .RDDRSS addrSFXx ;Stack-deferred indexed addressing 


CB0009 LDWX oldPC4,s ;Immediate addressing 
780002 SUBX ays ;Oprnd = OprndSpec 
ESFC13 opAddr,d 

01 


CB0009 oldPC4,s ;Direct addressing 
780002 pe ;Oprnd = Mem[OprndSpec] 


cD0000 0,x 
E9FC13 opAddr,d 
01 


CB0009 oldPC4,s iIndirect addressing 

780002 2já ;Oprnd = Mem[Mem[OprndSpec] ] 
CD0000 One 

CD0000 0,x 

E9FC13 opAddr,d 

01 


CB0009 oldPC4,s ;Stack-relative addressing 
780002 Det: ;Oprnd = Mem[SP + OprndSpec] 
CD0000 0,x 

6BO00B oldSP4,s 

E9FC13 opAddr,d 

01 


CB0009 oldPC4,s ;Stack-relative deferred addressing 
780002 2,i ;Oprnd = Mem[(Mem[SP + OprndSpec] ] 
CD0000 0,x 

6B000B oldSP4,s 

CD0000 0,x 

E9FC13 opAddr,d 





图 8-10 Pep/9 操作 系统 中 陷阱 操作 数 地 址 计算 
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01 


CB0009 
780002 
CD0000 
6B0007 
E9FC13 
01 


CB0009 
780002 
CD0000 
6B0007 
6B000B 
E9FC13 
01 


CB0009 
780002 


e 前 提 条 件 : 栈 指令 的 PCB 在 系统 栈 上 。 


addrx: 


addrSXx: 


addrSFx: 


RU AA (Fe 4B) 


oldPC4,s 
Big ds 

0,x 
oldx4,s 
opAddr,d 


oldPC4,s 
2,2 

0,x 
oldx4,s 
oldSP4,s 
opAddr,d 


oldPC4,s 
2,i 

0,x 
oldSP4,s 
0,x 
oldx4,s 
opAddr,d 


; Indexed addressing 
;Oprnd = Mem[(OprndSpec + X] 


;Stack-indexed addressing 
;Oprnd = Mem[SP + OprndSpec + X] 


;Stack-deferred indexed addressing 
;Oprnd = Mem[Mem[SP + OprndSpec] + XI] 





图 8-10 (4) 
图 8-10 的 例 程 有 下 列 前 提 和 后 置 条 件 : 


。 后 置 条 件 : opAddr 包含 根据 陷阱 指令 的 寻 址 方式 计算 的 操作 数 地 址 。 


与 图 8-8 中 寻 址 方式 断言 例 程 一 样 ，PCB 中 寄存 器 副本 的 栈 偏 移 量 比 陷 阱 刚 发 生 时 大 
了 4 字 节 ， 如 图 8-7b 所 示 。 这 个 例 程 用 寻 址 方式 断言 例 程 中 定义 的 oldIR4， 类 似 的 还 有 


oldX4、oldPC4 和 oldSP4， 分 别 用 来 访问 保存 的 变 址 寄存 器 副本 、 程 序 计 数 器 和 栈 指针 。 


从 FCCE 开始 的 前 4 条 语句 确定 陷阱 指令 的 寻 址 方式 ， 并 分 支 到 该 寻 址 方式 对 应 的 计 
算 , 使 用 的 是 转移 表 技 术 在 8 种 可 能 性 中 进行 选择 。8 种 选择 中 每 一 个 的 代码 都 通过 检查 陷 


阱 发 生 时 CPU 的 状态 来 计算 操作 数 的 地 址 。 


每 个 计算 的 前 两 条 指令 都 是 


LDWX oldPC4, 


SUBX 2,i 


因为 陷阱 指令 是 非 一 元 的 ， 所 以 陷阱 发 生 时 程序 计数 器 指向 2 字 节 操作 数 指示 符 后 面 的 那个 
字 节 。 第 一 条 指令 把 保存 的 程序 计数 器 装 入 变 址 寄存 器 ， 第 二 条 指令 将 它 减 去 2。 这 两 条 指 


S 


令 执 行 后 ， 变 址 寄存 器 包含 引发 陷阱 的 指令 中 的 操作 数 指示 符 的 地 址 。 
对 于 立即 数 寻 址 ， 操 作 数 指示 符 就 是 操作 数 ， 因 此 地 址 FCEE 的 语句 


STWX opAddr, 


RET 


d 


只 是 如 要 求 的 那样 把 操作 数 指示 符 的 地 址 存储 到 opAddr 中 。 
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对 于 直接 寻 址 ， 操 作 数 指示 符 是 操作 数 的 地 址 ， 地 址 FCF8 开始 的 第 一 条 语句 


LDWX 0,x 

STWX opAddr,d 

RET 
用 变 址 寄存 器 中 地 址 所 指向 内 存 的 内 容 蔡 换 变 址 寄存 器 。 在 指令 执行 前 ， 变 址 寄存 器 包含 的 
是 操作 数 指示 符 的 地 址 ， 在 指令 执行 后 ， 变 址 寄存 器 包含 的 是 操作 数 指示 符 本 身 。 因 为 操作 
数 指示 符 是 操作 数 的 地 址 ， 所 以 把 它 存 储 在 opAddr 中 。 

对 于 间接 寻 址 ， 操 作 数 指示 符 是 操作 数 地 址 的 地 址 。 和 直接 寻 址 一 样 ， 地 址 FD05 开始 
的 第 一 条 语句 

LDWX 0,x 

LDWX 0,x 

STWX opAddr,d 

RET 
用 操作 数 指示 符 本 身 蔡 换 变 址 寄存 器 的 内 容 ， 即 操作 数 地 址 的 地 址 。 第 二 条 指令 获取 操作 数 
的 地 址 ， 存 储 在 opAddr 中 。 

对 于 栈 相 对 寻 址 ， 栈 指针 加 上 操作 数 指示 符 等 于 操作 数 的 地 址 。 地 址 FD15 开始 的 第 一 
条 语句 

LDWX 0,x 

ADDX oldSP4,s 


STWX opAddr,d 
RET 


把 操作 数 指示 符 放 进 变 址 寄存 器 中 ， 第 二 条 指令 把 它 加 上 栈 指针 的 副本 ， 结 果 就 是 操作 数 的 
地 址 ， 将 其 存储 在 opAddr 中 。 

剩 下 的 4 种 寻 址 方式 用 类 似 的 技术 来 计算 操作 数 的 地 址 。 栈 相对 间接 寻 址 比 栈 相对 寻 址 
多 一 层 间接 的 过 程 ， 要 求 多 执行 一 条 LDWX 0,x。 除 了 把 操作 数 指示 符 加 到 变 址 寄存 器 上 而 
不 是 加 到 栈 指 针 上 以 外 ， 变 址 寻 址 和 栈 相 对 寻 址 是 一 样 的 。 栈 变 址 寻 址 和 栈 间 接 变 址 寻 址 也 
是 类 似 的 变换 。 


8.2.6 空 操作 陷阱 处 理 程序 


图 8-11 展示 了 实现 空 操作 陷阱 处 理 程序 的 代码 。 因 为 空 操作 指令 不 做 任何 事情 ， 所 以 
陷阱 处 理 程序 除了 执行 RET 把 控制 返回 图 8-6 的 出 口 点 并 最 终 返回 给 陷阱 语句 后 面 的 语句 
外 , 不 做 任何 其 他 处 理 。 

提供 空 操作 指令 是 为 了 允许 我 们 编写 自己 的 陷阱 处 理 程序 。 本 章 示 尾 的 习题 会 让 你 实 
现 一 些 Pep/9 指令 集中 没有 的 指令 。Pep/9 汇编 器 让 你 重新 定义 陷阱 指令 的 助 记 符 。 要 写 一 
个 陷阱 处 理 程序 ， 把 图 8-11 中 的 一 个 空 操作 指令 的 助 记 符 变 成 新 指令 的 助 记 符 ， 接 着 编辑 
操作 系统 中 的 陷阱 处 理 程 序 ， 在 人 口 点 插入 你 的 代码 即 可 。 例 如 ， 要 重新 定义 NOP0， 在 
FD6B 插入 你 的 处 理 程序 的 代码 。 处 理 程序 最 后 一 条 可 执行 语句 应 该 是 RET。 

图 8-11 展示 了 地 址 FD6D 处 的 非 一 元 NOP 的 实现 。 图 5-2 说 明了 它 唯 一 允许 的 寻 址 方 
式 是 立即 数 寻 址 ， 因 此 addrMask 的 值 被 置 为 0000 0001， 这 里 最 后 的 1 所 在 的 位 对 应 于 立 
即 数 寻 址 ， 如 图 8-9 所 示 。 
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j***keee Opcode 0x26 
;The NOPO instruction. 
opcode26 : RET 


i 

peewee Opcode 0x27 
;The NOP1 instruction. 
opcode27:RET 


jeeeeeee Opcode 0x28 
;The NOP instruction. 
C00001 opcode28:LDWA 0x0001,i ;Assert i 
E1FC11 STWA addrMask,d 
24FC7C CALL assertAd 
01 RET 


图 8-11 NOP 陷阱 处 理 程序 





8.2.7 DECI 陷阱 处 理 程序 


本 小 节 描 述 DECI 指令 的 陷阱 处 理 程序 。DECI 必须 对 输入 进行 语法 分 析 ， 把 ASCII F 
符 串 转换 成 适当 的 补 码 表示 的 位 。 它 使 用 图 8-12 的 有 限 状 态 机 (FSM)， 而 图 8-13 Æ DECI 
陷阱 处 理 程序 的 FSM 的 逻辑 框架 ，state 是 枚 举 类 型 ， 可 能 的 值 是 init, sign 或 digit, 


digit 





图 8-12 DECI 中 断 处 理 程序 的 有 限 状态 机 


isOvfl < FALSE 
state ¢ init 
do 
LDBA chariIn,d 
STBA asciiCh,s 
switch state 
case init: 
if (asciich == '+') { 
isNeg & FALSE 
state & sign 
} 
else if (asciiCh == 
isNeg < TRUE 
state & sign 


} 


else if (asciiCh isadigit) { 


图 8-13 DECI 陷阱 处 理 程序 的 程序 逻辑 





isNeg & FALSE 
total < value(asciiCh) 
state & digit 
} 
else if (asciiCh isnot <SPACE> or <LF>) { 
Exit with DECI error 


} 
case sign: 
if (asciiCh isa digit) { 


total © value (asciiCh) 
state & digit 
} 
else { 
Exit with DECI error 
} 
case digit: 
if (asciiCh isadigit) { 
total < 10 * total + value (asciiCh) 
if (overflow) { 
isOvfl ¢ TRUE 
} 
} 


else { 
Exit normally 


} 


end switch 


while (not exit) 


图 8-14 是 DECI 陷阱 处 理 程 序 代 码 。 从 地 址 FD77 开始 的 4 条 语句 调用 寻 址 方式 断言 
例 程 和 计算 陷阱 操作 数 地 址 的 例 程 。 在 地 址 FD83， 处 理 程序 在 栈 上 分 配 了 7 个 局 部 变量 : 
total, asciiCh valAscii, isOvfl, isNeg, state 和 temp， 除 了 asciiCh 之 外 ， 每 个 变量 占 2 字 节 ， 
因此 SUBSP 将 栈 指针 减 去 13。 对 于 应 用 程序 来 说 ，SUBSP 是 过 程 中 第 一 条 使 用 局 部 变量 
的 可 执行 语句 ， 必 须 在 前 面 两 个 例 程 调用 之 后 执行 ， 因 为 这 两 个 调用 会 访问 来 自 PCB 的 数 





图 8-13 ( 续 ) 


据 ， 它 们 假定 栈 上 只 有 两 个 返回 地 址 ， 如 图 8-7b 所 示 。 


;x*¥eeeRe Opcode 0x30 
;The DECI instruction. 
;Input format: Any number of Teading spaces or line féeds are 
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;allowed, followed by '+', '-' or a digit as the first character, 


;after which digits are input until the first nondigit is 


;encountered. The status flags N,Z and V are set appropriately 


iby this DECI routine. The C status flag is not affected. 


ti 


OldNZVC: .EQUATE ;Stack address of NZVC on interrupt 


i 


total: 


. EQUATE ;Cumulative total of DECI number 


asciiCh: .EQUATE jasciiCh, one byte 
valAscii: .EQUATE j; value (asciiCh) 


图 8-14 DECI 陷阱 处 理 程序 
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PED 


COOOFE 
E1FC11 
24FC7C 
24FCCE 
58000D 
C00000 
E30006 
C00000 
E30002 


D1FC15 
F3000A 
80000F 
E30008 
D3000A 
CBO002 
0B 

13FDA8 


FDAE 
FE08 
FE23 


B0002B 
1AFDC3 
C80000 
EB0004 
c80001 
EB0002 
12FD92 


B0002D 
1AFDD8 
C80001 
EBO004 
C80001 
EB0002 
12FD92 


B00030 
16FDF9 


isOvfl: 
isNeg: 
state: 
temp: 
init: 
sign: 
digit: 


i 


opcode30: 


i 


stateJT: 


i 


ifMinus: 


ifDigit: 


. EQUATE 
. EQUATE 
. EQUATE 
. EQUATE 


. EQUATE 


BRIER (#4 B) 


.EQUATE 1 
-EQUATE 2 


LDWA 
STWA 


0x00FE, i 
addrMask,d 
assertAd 
setAddr 
13;,;% 
FALSE,i 
isOvfl,s 
init, i 
state,s 


chariIn,d 
asciiCch,s 
0x000F, i 
valAscii,s 
asciiCh,s 
state,s 


stateJT,x 


sInit 
sSign 
sDigit 


hale: 
ifMinus 
FALSE, i 
isNeg,s 
sign,i 
state,s 
do 


terg 


ifDigit 
TRUE, i 
isNeg,s 


sign,i 
state,s 
do 


10", i 
ifWhite 


图 8-14 


;Overflow boolean 


;Negative boolean 


;State variable 


;Enumerated values for state 


;Assert d, n, s, sf, x, sx, sfx 


;Set address of trap operand 


;Allocate storage for locals 
;isOvfl <- FALSE 


;State <- init 


;Get asciiCh 


;Set value (asciiCh) 


jA<low> 


asciiCh throughout the loop 


;Switch (state) 
;Two bytes per address 


PLE (asciich ss 


;isNeg <- FALSE 


;state <- sign 


;else if 


(asciiCh == '-') 


;isNeg <- TRUE 


;State <- sign 


;else if 


(2) 


(asciiCh is a digit) 





B00039 
1EFDF9 
C80000 
EB0004 
CB0008 
EB000B 
C80002 
EB0002 
12FD92 


B00020 
18FD92 
BOOOOA 
1AFEBE 
12FD92 


B00030 
16FEBE 
B00039 
1EFEBE 
CB0008 
EB000B 
C80002 
EB0002 
12FD92 


B00030 
16FE74 
B00039 
1EFE74 
c80001 
C3000B 
OA 

20FE3C 
12FE3F 
EB0006 
E30000 
OA 

20FE49 
12FE4C 
EB0006 
OA 

20FE53 
12FE56 
EB0006 
630000 
20FE5F 
12FE62 
EB0006 
630008 
20FE6B 


ifWhite: 


tt 
ifWhite 
FALSE,i 
isNeg,s 
valAscii,s 
total,s 
digit,i 
state,s 

do 


14 
do 
'N\n',d 
deciErr 
do 


'O' ed 
deciErr 
154 a 
deciErr 
valAscii,s 
total,s 
digit,i 
state,s 

do 


640.4 
deciNorm 
"91i 
deciNorm 
TRUE, i 
total,s 


ovfl1 

L1 
isOvfl,s 
temp,s 


ovfl2 
L2 
isOvfl,s 


ov£13 

L3 
isOvfl,s 
temp,s 
ovf14 

L4 
isOvfl,s 
valAscii,s 
ovf15 


图 8-14 
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;isNeg <- FALSE 
;total <- value (asciiCh) 


;state <- digit 


;else if (asciiCh is not a space 
;or line feed) 

;exit with DECI error 

;if asciiCh (is not a digit) 
;exit with DECI error 

;else total <- value(asciiCh) 
;State <- digit 


;if (asciiCh is not a digit) 


;exit normaly 


;else X <- TRUE for later assignments 
;Multiply total by 10 as follows: 
;First, times 2 


;If overflow then 


;isOvfl <- TRUE 

;Save 2 * total in temp 
;Now, 4 * total 

;If overflow then 


;isOvfl <- TRUE 
;Now, 8 * total 
iIf overflow then 


jisOvfl <- TRUE 
;Finally, 8 * total + 2 * total 
;If overflow then 


jisOvfl <- TRUE 
;A <- 10 * total + valAscii 
;IE overflow then 


( 续 ) 
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1L2FE6E L5 

EB0006 isOvfl,s ;isOvfl <- TRUE 
E3000B : total,s ;Update total 
12FD92 do 


C30004 deciNorm: LDWA isNeg,s ;If isNeg then 

18FE90 BREQ SetNZ 

C3000B LDWA total,s ;If total != 0x8000 then 
A08000 CPWA 0x8000,i 

18FE8A BREQ L6 

08 NEGA ;Negate total 

E3000B STWA total,s 

12FE90 BR setNZ 

C00000 z FALSE, i ;else -32768 is a special case 
E30006 STWA isOvfl,s ;isOvfl <- FALSE 

DBOOOF setNZ: LDBX oldNZVC,s ;Set NZ according to total result: 
880001 ANDX 0x0001,i ;First initialize NZV to 000 
C3000B LDWA total,s ;If total is negative then 
1CFE9F BRGE checkZ 

980008 ORX 0x0008,i ;set N to 1 

A00000 checkZ: CPWA p;i ;If total is not zero then 
1AFEA8 BRNE setv 

980004 ORX 0x0004,i Bet Z tol 

C30006 setv: LDWA isOvfl,s ;If not isOvfl then 

18FEB1 BREQ storeFl 

980002 ORX 0x0002,i Bet V to 1 

FBOOOF storeFl: STBX oldNZVC,s ;Store the NZVC flags 

C3000B exitDeci:LDWA total,s ;Put total in memory 

E2FC13 STWA opAddr,n 

50000D ADDSP ee ;Deallocate locals 

01 RET ;Return to trap handler 
DOOOOA deciErr: LDBA hn i 

F1FC16 STBA charOut,d 


COFED1 LDWA deciMsg,i ;Push address of message onto stack 
E3FFFE STWA -2,8 

580002 SUBSP 24 

24FFDE CALL prntMsg jand print 

00 STOP ;Fatal error: program terminates 


i 


455252 deciMsg: .ASCII "ERROR: Invalid DECI input\x00" 





K 8-14 ( 续 ) 


DECI 陷阱 处 理 程序 必须 通过 PCB 访问 NZVC 位 。 图 8-6 中 地 址 FC6E 的 CALL 指令 调 
用 此 处 理 程序 ，CALL 指令 把 2 字 节 的 返回 地 址 压 和 人 栈 。 当 处 理 程序 访问 陷阱 发 生 时 存储 在 
栈 上 的 NZVC 值 时 ， 由 于 局 部 变量 和 返回 地 址 的 原因 ， 它 的 栈 地 址 将 比 陷阱 刚刚 发 生 后 大 
15。 这 就 是 为 什么 oldNZVC 等 于 15 而 不 是 0。 

DECI 中 断 处 理 程序 从 地 址 FD86 的 LDWA 语句 开始 ， 它 的 处 理 遵 循 图 8-13 的 逻辑 。 
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例 程 检测 值 超出 范围 的 输入 字符 串 ， 如 果 检 测 到 了 ， 就 在 陷阱 期 间 把 PCB 中 的 V 位 设置 为 
1, “4 RETTR 将 控制 返回 给 应 用 程序 后 ，Asmb5 层 程序 员 将 能 够 检测 执行 DECI 后 的 溢出 。 
isOvf 是 一 个 布尔 标志 ， 指 示 是 否 发 生 了 溢出 。 

地 址 FD92 是 FSM 循环 的 开始 ， 从 do 符号 可 以 看 出 来 。FD98 的 ANDA 屏蔽 了 最 右 4 
位 以 外 其 余 的 输入 字符 ， 留 下 的 是 十 进 制 ASCII 数字 对 应 的 二 进 制 值 。 例 如 ，ASCI 的 5 的 
二 进 制 表示 是 0011 0101， 最 右 4 位 0101 是 十 进 制 数 相应 的 二 进 制 值 。 地 址 FD9E 处 ， 累 加 
器 获得 该 ASCI 字符 ， 并 在 整个 循环 过 程 中 保持 它 。 地 址 FDA8 的 stateJT 是 FSM 中 switch 
语句 的 转移 表 。 

从 地 址 FEAE 到 FE05 的 代码 是 state 为 值 sInit 的 情况 ， 即 FSM 的 起 始 状态 。 因 为 整个 
循环 过 程 中 累加 器 要 保持 ASCII 字符 用 于 比较 ， 所 以 所 有 的 赋值 语句 都 是 通过 变 址 寄存 器 
而 不 是 累加 器 进行 。 例 如 ， 地 址 FDB4 的 isNeg 赋值 为 FALSE 是 通过 LDWX 后 面 跟 STWX 
而 不 是 LDWA 后 面 跟 STWA 来 执行 的 。 

从 地 址 FE08 到 FE20 的 代码 是 state 为 值 sSign 的 情况 ， 从 地 址 FE23 到 FE71 是 state 
为 值 sDigit 的 情况 。Pep/9 没有 把 一 个 值 乘 以 10 (dec) 的 指令 ， 这 段 代 码 用 多 个 左 移 运算 来 
执行 这 个 乘法 。 每 个 ASLA 把 值 乘 以 2，3 个 ASLA 运算 将 值 乘 以 8， 把 这 个 值 加 上 原始 值 
乘 以 2 就 得 到 这 个 值 乘 以 10 的 值 。 每 次 执行 ASLA 运算 和 加 法 运算 之 后 ， 该 例 程 会 检测 溢 
出 并 相应 地 设置 isOvfl。 

从 地 址 FE74 到 FF20 的 代码 在 循环 之 外 。 在 两 种 情况 下 算法 会 退出 循环 : 正常 退出 或 
者 检测 到 输入 错误 。 如 果 正 常 退出 ， 它 会 检测 isNeg 看 数字 串 前 面 是 否 有 负 号 ， 如 果 有 ， 地 
址 FE83 的 指令 通过 取 补 码 将 这 个 数 取 负 。 

数字 32 768 (dec) 等 于 8000 (hex)， 必 须 当 作 一 种 特殊 情况 来 处 理 。 如 果 输 入 是 -32 768, 
当地 址 FE62 的 32 760 加 8 时 ，FSM 将 把 isOvfl 设置 为 true。 问 题 是 尽管 -32 768 在 范围 
内 , 但 32 768 超出 范围 。 该 例 程 在 地 址 FE8D 为 这 种 特殊 情况 调整 isOvfl。 

从 地 址 FE90 到 FFB1 的 代码 调整 进入 陷阱 时 存储 的 N、Z 和 V 标志 位 的 副本 。 地 址 
FE93 的 ANDX 把 NZV 设置 为 000。 注 意 掩 码 是 01 (hex), BP 0000 0001 (bin)。 因 为 C 是 
最 右 位 ， 所 以 AND 运算 后 它 保持 不 变 。 地 址 FE96 的 LDWA 把 已 分 析 的 值 放 人 累加 器 ， 并 
相应 地 设置 CPU 中 N、Z 和 V 位 的 当前 值 。 代码 把 PCB 中 N 和 Z 的 副本 设置 成 等 于 CPU 
中 N 和 Z 的 当前 值 ， 根 据 先前 分 析 中 计算 的 isOvfl 值 设置 PCB 中 V 的 副本 。 

现在 已 经 输入 和 分 析 了 该 十 进 制 值 ， 陷 阱 处 理 程序 必须 要 把 它 存 储 在 内 存 中 ， 存 储 地 址 
是 由 引发 陷阱 的 DECI 的 操作 数 指定 的 。FFB4 处 的 指令 


LDWA total,s 
STWA opAddr,n 


执行 这 个 存储 。LDWA 把 计算 出 的 值 装 入 累加 器 ，STWA 用 间接 寻 址 把 它 存 储 到 opAddr, 
对 于 间接 寻 址 方式 操作 数 指示 符 是 操作 数 地 址 的 地 址 。 回 想 先前 在 FD80 处 计算 了 操作 数 的 
地 址 ， 并 存储 在 opAddr 中 ， 因 此 opAddr 就 是 操作 数 地 址 的 地 址 ， 它 正 是 我 们 所 需要 的 。 

当 输 入 字符 串 不 能 正常 分 析 时 ， 执 行 从 FFBE 到 FFDO 的 代码 ， 它 会 通过 调用 prntMsg 
输出 错误 信息 。 如 图 8-16 所 示 ，prntMsg 过 程 输出 以 空 结 尾 的 字符 串 并 立即 终止 应 用 程序 。 


8.2.8 DECO 陷阱 处 理 程序 
图 8-15 是 DECO 指令 的 陷阱 处 理 程序 。 这 个 程序 输出 DECO 的 操作 数 ， 输 出 格式 等 价 
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493 
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F C 中 对 整数 值 的 printf() 函数 调用 。 因 为 能 存储 的 最 大 值 是 32 767， 所 以 这 个 例 程 最 多 输 
出 5 位 数 的 字符 。 如 果 需 要 ， 会 在 数值 前 面 加 上 人 负 号 ， 即 ASCII 连 字符 。 


z;¥*kekeEe Opcode 0x38 

;The DECO instruction. 

;Output format: If the operand is negative, the algorithm prints 
ja single '-' followed by the magnitude. Otherwise it prints the 
;magnitude without a leading '+'. It suppresses leading zeros. 


t 


remain: .EQUATE 0 ;Remainder of value to output 


outYet: .EQUATE 2 ;Has a character been output yet? 
place: . EQUATE 4 ;Place value for division 
COOOFF opcode38:LDWA OxOOFF,i ;Assert i, d, n, S, sf, x, sx, sfx 
ELFC11 STWA addrMask,d 
24FC7C CALL assertAd 
24FCCE CALL setAddr ;Set address of trap operand 
580006 SUBSP 6,i ;Allocate storage for locals 
C2FC13 LDWA opAddr,n ;A <- oprnd 
A00000 CPWA 0,i ;IE oprnd is negative then 
1CFFOA BRGE printMag 
D8002D LDBX el ;Print leading '-' 
F9FC16 STBX charOut,d 
08 NEGA ;Make magnitude positive 
E30000 printMag:STWA remain,s j;remain <- abs (oprnd) 
C00000 LDWA FALSE,i ;Initialize outYet <- FALSE 
E30002 STWA outYet,s 
c02710 LDWA 10000,i ;place <- 10,000 
E30004 place,s 
24FF44 divide ;Write 10,000's place 
C003E8 1000,i ;place <- 1,000 
E30004 place,s 
24FF44 divide ;Write 1000's place 
co0064 100,i ;place <- 100 
E30004 place,s 
24FF44 divide ;Write 100’s place 
COOOOA 10,i ;place <- 10 
E30004 place,s 
24FF44 divide ;Write 10's place 
C30000 remain,s ;Always write 1’s place 
900030 0x0030,i ;Convert decimal to ASCII 
F1FC16 charOut,d ; and output it 
500006 6,1 ;Dallocate storage for locals 
01 
; Subroutine to print the most significant decimal digit of the 
;remainder. It assumes that place (place2 here) contains the 
;decimal place value. It updates the remainder. 


remain2: .EQUATE 2 ;Stack addresses while executing a 





outYet2: .EQUATE 4 ; subroutine are greater by two because 


图 8-15 DECO 陷阱 处 理 程序 
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place2: .EQUATE 6 ; the retAddr is on the stack 


C30002 divide: remain2,s ;A <- remainder 

C80000 0,i 7X <- 0 

730006 divLoop: place2,s ;Division by repeated subtraction 
16FF59 writeNum ;If remainder is negative then done 
680001 hai 7K <- X41 

E30002 remain2,s ;Store the new remainder 

12FF4A divLoop 


A80000 writeNum: 0,i If X l= 0 then 

18FF68 checkout 

C00001 TRUE, i ;outYet <- TRUE 

E30004 outYet2,s 

12FF6F printDgt ;and branch to print this digit 
C30004 checkOut: outYet2,s ;else if a previous char was output 
1AFF6F printDgt ithen branch to print this zero 

01 ;else return to calling routine 


i 

980030 printDgt: 0x0030,i ;Convert decimal to ASCII 
F9FC16 charOut,d ; and output it 

01 ;return to calling routine 


图 8-15 ( 续 ) 


通常 ， 陷 阱 处 理 程序 从 FEEB 开头 的 语句 判断 寻 址 方式 是 否 合法 ， 调 用 例 程 计 算 操 作 数 
的 地 址 ， 给 局 部 变量 分 配 存储 空间 。 和 DECI 陷阱 处 理 程 序 相 比 ，FEFA 的 语句 





LDWA opAddr,n 


用 装 入 指令 而 不 是 存储 指令 来 访问 操作 数 ， 因 为 DECO 是 一 个 输出 语句 而 不 是 输入 语句 。 
Al DECI 处 理 程序 一 样 ， 采 用 间接 寻 址 方式 通过 opAddr 访问 操作 数 。 

从 FEFD 到 FF09 的 代码 检测 是 否 是 负 值 。 如 果 操 作 数 为 负 ，FF03 的 字 节 装 和 信和 字 节 存 
储 指令 输出 负 号 ， 接 着 后 面 的 代码 对 操作 数 取 负 。 在 FF0A ， 累 加 器 包含 操作 数 的 数值 ， 它 
存储 在 remain 中 ， 代 表 余数 。 

从 FF0D 到 FF34 的 代码 写 出 操作 数 数 值 的 万 位 、 千 位 、 百 位 和 十 位 。 为 了 防止 在 最 开 
LEMO, H outYet 初始 化 为 false， 表 示 还 没有 输出 任何 数字 字符 。 

子 例 程 divide 输出 place 位 置 值 上 的 数字 字符 ， 减 小 remain 用 于 下 次 调用 。 人 例如， 如果 
在 FF19 处 调用 divide 之 前 remain 的 值 是 24 873， 那 么 divide 将 输出 2， 并 将 remain 变 为 
4873， 还 把 outYet 设置 为 true。 

在 输出 字符 0 之 前 ，divide 检测 outYet 是 否 已 经 输出 了 数字 字符 。 如 果 outYet 为 false, 
那么 该 字符 是 前 导 0， 不 能 输出 ; 否则 是 中 间 的 0， 可 以 输出 。 例 如 ， 如 果 在 FF22 处 的 调用 
之 前 remain 是 761， 那 么 divide 什么 都 不 输出 ，remain 继续 保持 为 761，outYet 也 继续 保持 
为 false。 不 管 outYet 的 值 是 什么 ， 从 FF37 开始 的 代码 都 写 个 位 ， 因 此 如 果 原 始 操作 数 的 值 
是 0， 就 输出 0。 

从 FF44 到 FF75 的 代码 是 输出 remain 最 高 有 效 位 的 子 例 程 。 它 通过 反复 从 remain 减 去 
place 来 确定 输出 值 ， 记 录 减 法 的 次 数 ， 直 到 remain 小 于 0。 它 的 作用 是 计算 remain/place 
输出 的 值 。 
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8.2.9 HEXO #1 STRO 陷阱 处 理 程序 和 操作 系统 向 量 


图 8-16 是 HEXO 和 STRO 指令 的 陷阱 处 理 程 序 ， 在 功能 上 类 似 于 DECO 陷阱 处 理 程 
序 。 因 为 STRO 是 一 条 输出 指令 ， 所 以 首先 用 FFCE 的 指令 


LDWA opAddr,d 


获取 操作 数 的 地 址 ， 然 后 把 要 输出 的 字符 串 的 地 址 压 和 人 运行 时 栈 ， 调 用 FFD7 的 prntMsg F 
例 程 。 实 际 上 ， 字 符 串 就 是 一 个 字符 数组 ， 所 以 这 个 处 理 类 似 于 一 个 以 数组 作为 参数 传递 的 
C 程序 的 翻译 。 因 此 输出 子 例 程 在 语句 

LDBA msgAddr, sfx 


中 使 用 栈 间 接 变 址 寻 址 方式 来 访问 字符 数组 的 一 个 元 素 。 


j;******* Opcode 0x40 
;The HEXO instruction. 
;Outputs one word as four hex characters from memory. 
COOOFF opcode40:LDWA OxOOFF,i ¿Assert i, d, n, S, sf, x, sx, sfx 
ElFC11 addrMask,d 
24FC7C assertAd 
24FCCE setAddr ;Set address of trap operand 
C2FC13 opAddr,n ;A <- oprnd 
E1FCOF wordTemp,d ;Save oprnd in wordTemp 
D1FCOF wordTemp,d ;Put high-order byte in low-order A 
oc ;Shift right four bits 
oc 
oc 
oc 
24FFA9 hexOut ;Output first hex character 
D1FCOF wordTemp,d ;Put high-order byte in low-order A 
24FFA9 hexOut ;Output second hex character 
D1FC10 byteTemp,d ;Put low-order byte in low order A 
oc ;Shift right four bits 
oc 
oc 
oc 
24FFA9 hexOut ;Output third hex character 
D1FC10 byteTemp,d ;Put low-order byte in low order A 
24FFA9 hexOut ;Output fourth hex character 
01 
; Subroutine to output in hex the least significant nybble of the 
;accumulator. 
80000F hexOut: ANDA 0x000F, i ;Isolate the digit value 
B00009 CPBA 9,i FIE it is not in 0..9 then 
14FFBB BRLE prepNum 
700009 SUBA D ; convert to ASCII letter 
900040 ORA 0x0040,i ; and prefix ASCII code for letter 
12FFBE BR writeHex 





图 8-16 HEXO 和 STRO 指令 的 陷阱 处 理 程序 
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900030 prepNum: ORA 0x0030,i ;else prefix ASCII code for number 
F1FC16 writeHex:STBA charOut,d ;Output nybble as hex 
01 RET 
让 Opcode 0x48 
¿The STRO instruction. 
¿Outputs a null-terminated string from memory. 
C0003BE opcode48:LDWA 0x003E, i ¿Assert d, n, s, sf, x 
E1FC11 STWA addrMask,d 
24FC7C CALL assertAd 
24FCCE CALL setAddr ;Set address of trap operand 
C1FC13 LDWA opAddr,d ;Push address of string to print 
E3FFFE STWA -2,8 
580002 SUBSP 23.3 
24FFDE CALL prntMsg jand print 
500002 ADDSP 2,2 
01 RET 
;******* Print subroutine 


;Prints a string of ASCII bytes until it encounters a null 


;byte (eight zero bits). Assumes one parameter, which 


;contains the address of the message. 
i 
msgAddr: .EQUATE 2 jAddress of message to print 
C80000 prntMsg: LDWX 9i iX <- 0 
C00000 LDWA 0,i 7A <- 0 
D70002 prntMore:LDBA msgAddr,sfx ;Test next char 
18FFF3 BREQ exitPrnt ;If null then exit 
F1FC16 STBA charOut,d ;else print 
680001 ADDX a, 7X <- X + 1 for next character 
12FFE4 BR prntMore 
01 exitPrnt:RET 
;*****k* Vectors for system memory map 
-ADDRSS osRAM iUser stack pointer 
-ADDRSS wordTemp ;System stack pointer 
.ADDRSS charIn ;Memory-mapped input device 
.ADDRSS charOut ;Memory-mapped output device 
-ADDRSS loader ;Loader program counter 
-ADDRSS trap ;Trap program counter 





K 8-16 (42) 


机 器 向 量 是 用 .ADDRSS 汇编 伪 指 令 建立 的 。 把 这 个 代码 与 图 8-1 和 图 8-2 进行 比较 ， 
你 会 看 到 FFF4 处 的 向 量 是 osRAM 的 地 址 ， 它 是 操作 系统 RAM 顶部 的 字 节 。 当 用 户 选 择 
模拟 器 的 执行 选项 时 ,硬件 将 SP 初始 化 为 这 个 值 ， 它 是 用 户 堆 栈 底部 的 字 节 。 

FFF6 的 向 量 是 wordTemp 的 地 址 ， 它 是 第 一 个 系统 全 局 变量 。 图 8-2 显示 wordTemp 是 
预 留 给 系统 栈 的 128 字 节 存储 块 下 面 的 字 节 。 当 用 户 选择 模拟 器 的 装载 选项 时 ， 硬 件 把 SP 
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初始 化 为 这 个 值 ， 当 执行 陷阱 指令 时 ， 从 这 个 点 开始 把 PCB 压 人 栈 。 

接 下 来 ， 在 FFF8 和 FFFA 的 两 个 向 量 是 由 符号 charIn 定义 的 输入 设备 地 址 以 及 由 符号 
charOut 定义 的 输出 设备 地 址 。 在 翻译 时 ， 应 用 程序 汇编 器 自动 把 这 些 符 号 放 入 它 的 符号 表 
中 。 在 运行 时 ， 硬 件 模拟 器 用 这 些 向 量 来 了 解 IO 设备 映射 到 内 存 的 什么 地 方 。 

FFFC 的 向 量 是 装载 器 的 地 址 ， 如 图 8-3 所 示 。 当 用 户 选 择 装 载 选 项 时 硬件 将 PC 初始 
化 为 这 个 值 。FFFE 的 向 量 是 中 断 处 理 程序 进入 点 的 地 址 ， 如 图 8-6 所 示 。 当 执行 陷阱 指令 
时 ， 硬 件 将 PC 初始 化 为 这 个 值 。 


8.3 并 发 进程 


记 住 进程 是 执行 时 的 程序 。8.2 节 展 示 了 操作 系统 在 进程 的 执行 过 程 中 如 何 暂 停 它 来 提 
供 服 务 。 对 于 一 个 使 用 DECI 和 DECO 的 进程 ， 它 的 CPU 活动 时 间 线 如 图 8-17 所 示 。 阴 影 
部 分 代表 CPU 执行 陷阱 服务 例 程 的 时 间 。 这 个 图 除 展示 了 操作 系统 在 进程 结束 前 暂停 它 ， 
然后 在 这 个 服务 完成 后 继续 此 进程 外 ， 在 形式 上 类 似 于 图 8-4 的 时 间 线 。 


Ey U 


Beis 


应 用 程序 “DECI 陷 阱 应 用 程序 DECO 陷阱 ”应 用 程序 
图 8-17 ” 当 操 作 系统 执行 一 个 包含 DECI 和 DECO 指令 的 程序 时 ，CPU 使 用 的 时 间 线 


因为 正在 执行 的 进程 是 通过 操作 系统 代码 中 未 实现 的 操作 码 来 启动 这 些 陷阱 的 ， 所 以 
8.2 节 中 描述 的 陷阱 叫 作 软 中 断 ( software interrupt)。 它 们 也 称 为 同步 中 断 (synchronous 
interrupt)， 因 为 每 次 执行 进程 时 中 断 同时 发 生 ， 中 断 和 代码 是 同步 的 ， 是 可 以 预测 的 。 

另 一 个 启动 同步 中 断 的 方法 是 执行 一 个 操作 系统 调用 。 操 作 系 统 调用 通常 的 汇编 层 助 记 
符 是 SVC， 它 代表 管理 程序 调用 (supervisor call)。 操 作 数 指示 符 一 般 作为 系统 调用 的 参数 ， 
告诉 系统 程序 想 请 求 哪个 服务 。 例 如 ， 如 果 你 想 用 与 C 中 的 fflush (stdin) 对 等 的 函数 来 刷 
新 缓冲 区 中 流 的 内 容 ，fflush() 的 代码 是 27， 可 以 执行 


SVC 27, i 


8.3.1 异步 中 断 


另 一 种 类 型 的 中 断 是 异步 中 断 (asynchronous interrupt)， 在 执行 期 间 ， 它 的 发 生 时 间 不 
可 预测 。 异 步 中 断 的 两 个 常见 原因 是 : 

o 超时 

e 1/0 完成 

为 了 了 解 超时 如 何 引发 异步 中 断 ， 考 虑 一 个 多 用 户 系 统 ， 它 允许 多 个 用 户 同时 访问 计算 
机 。 如 果 计 算 机 仅 有 一 个 CPU， 操作 系统 必须 轮流 把 CPU 分 配给 每 个 用 户 的 作业 一 一 使 用 
一 种 称 为 分 时 ( time sharing) 的 技术 。 操 作 系统 给 用 户 作 业 分 配 称 为 时 间 片 (time slice) 的 
时 间 量 ， 通 常 大 约 是 100ms ( 1/10 秒 ) 。 如 果 用 户 作 业 在 这 个 时 间 内 没有 完成 (这 种 情况 称 
为 超时 )， 那 么 操作 系统 暂时 停止 这 个 作业 ， 并 给 下 一 个 作业 分 配 另 一 个 CPU 时 间 量 。 

要 实现 分 时 ， 硬 件 必须 提供 一 个 闹钟 ， 这 样 操 作 系 统 可 以 设置 成 在 每 个 时 段 产生 一 个 中 
断 。 这 样 的 中 断 不 可 预测 的 原因 是 它 取决 于 系统 服务 用 户 的 请 求 有 多 忙 。 如 果 没 有 其 他 的 作 
业 等 待 使 用 CPU， 那 么 系统 可 以 让 你 的 作业 运行 得 比 标准 时 间 片 更 长 一 些 。 如 果 另 一 个 用 
户 突然 请 求 服务 ， 那 么 操作 系统 会 立刻 暂停 你 的 进程 ， 并 给 正在 请 求 的 作业 分 配 CPU。 此 
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时 ， 该 进程 的 中 断 时间 点 就 不 同 于 一 个 时 间 片 超时 时 的 时 间 点 。 

即使 计算 机 有 多 个 CPU， 蜡 步 中 断 也 会 以 同样 的 方式 发 生 。 操 作 系 统 为 系统 中 的 每 个 
CPU 分 配 单独 的 时 间 片 ， 并 为 每 个 CPU 管理 超时 。 

异步 中 断 第 二 个 常见 的 源 是 IO 完成 ,1/O 设备 的 一 个 基本 属性 是 ， 相 比 于 CPU 的 处 理 
速度 其 速度 很 慢 。 如 果 一 个 正在 运行 的 进程 请 求 从 键盘 输入 ， 用 户 的 响应 以 秒 计 ， 而 此 期 间 
CPU 可 以 执行 另 一 个 进程 的 几 十 万 条 指令 。 即 使 进程 从 磁盘 文件 请 求 输入 ， 也 比 从 键盘 输 
入 快 得 多 ,但 是 在 等 待 来 自 磁盘 的 信息 时 CPU 仍然 可 以 执行 数 千 条 指令 。 

为 了 不 浪费 CPU 时 间 ， 如 果 看 上 去 进程 需要 等 待 IO 完成 ,那么 操作 系统 可 以 暂停 请 
求 IO 的 进程 。 操 作 系 统 可 以 暂时 把 CPU 分 配给 第 二 个 进程 ， 当 知道 IO 完成 时 ， 第 一 个 
进程 可 以 立即 重新 获得 CPU。 因 为 第 二 个 进程 不 可 能 预测 IO 设备 何 时 将 完成 第 一 个 进程 的 
VO 操作 ， 因 此 它 不 知道 操作 系统 何 时 会 中 断 它 并 把 CPU 交 回 给 第 一 个 进程 。 

可 以 在 进程 间 切 换 以 保持 CPU 繁忙 的 单 CPU 操作 系统 叫 作 多 道 程序 设计 系统 
( multiprogramming system)。 要 实现 多 道 程序 设计 ， 硬 件 必须 向 IO 设备 提供 连接 ， 当 它们 
完成 输入 /输出 操作 时 可 以 给 CPU 发 送 中 断 信号 。 


8.3.2 ”操作 系统 中 的 进程 

操作 系统 的 一 个 目的 是 高 效 分 配 系统 资源 。 多 道 程序 分 时 系统 给 系统 中 的 作业 分 配 
CPU 时 间 ， 目 的 是 保持 CPU 尽 可 能 地 执行 用 户 的 作业 而 不 是 空闲 等 待 17O。 操 作 系 统 尽量 
公平 地 调度 CPU 时 间 ， 使 得 所 有 的 作业 都 可 以 在 合理 的 时 间 内 完成 。 

在 任何 给 定 的 时 刻 ， 操 作 系 统 都 必须 维护 许多 被 暂停 、 正 在 等 待 CPU 时 间 的 进程 。 它 
通过 给 每 个 进程 分 配 一 个 单独 的 PCB 来 维护 所 有 这 些 进 程 ， 这 个 PCB 类 似 于 Pep/9 系统 
的 中 断 处 理 程序 维护 的 PCB。 常 见 的 做 法 是 用 链表 中 的 指针 把 PCB 连接 在 一 起 ， 称 为 队列 
(queue)， 图 8-18 展示 的 就 是 一 个 PCB 队列 。 
























y 
图 8-18 进程 控制 块 的 队列 


每 个 PCB 包含 进程 在 最 近 一 次 中 断 时 所 有 CPU 寄存 器 值 的 副本 。 寄 存 器 组 必须 包含 程 
序 计 数 器 的 副本 ， 这 样 进程 就 可 以 从 中 断 发 生 的 位 置 继续 执 行 。 

PCB 包含 一 些 可 以 帮助 操作 系统 调度 CPU 的 信息 。 一 个 例子 是 系统 分 配 的 唯一 进程 标 
识 号 ， 即 图 8-18 中 的 进程 ID ， 它 起 到 标识 进程 的 作用 。 假 设 一 个 用 户 想 在 一 个 进程 正常 执 
行 完 之 前 终止 它 ， 他 知道 ID 是 782， 他 可 以 发 布 KILL(782) 命令 ， 让 操作 系统 搜索 PCB BA 
7), Rih ID Æ 782 的 PCB， 将 它 从 队列 中 删除 ， 并 释放 它 。 

另 一 个 存储 在 PCB 中 的 信息 的 例子 是 暂停 的 进程 截至 目前 使 用 的 CPU 时 间 总 量 。 如 果 
CPU 变 为 可 用 ， 操 作 系 统 必须 决定 暂停 的 进程 中 哪 一 个 将 得 到 CPU， 它 可 以 用 记录 的 时 间 
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做 出 一 个 公平 的 决定 。 
作业 在 系统 中 执行 直至 完成 ， 要 经 过 多 个 状态 ， 如 图 8-19 所 示 。 这 个 图 是 以 状态 转换 
图 的 形式 呈现 的 ， 刀 有 限 状 态 机 的 又 一 个 例子 。 每 个 转移 都 标明 了 导致 状态 改变 的 事件 。 


1/0 ao 
7 选择 运行 






IO 请 求 


准备 好 
创建 进程 超时 终止 进程 


图 8-19 操作 系统 中 作业 的 状态 转换 图 


当 用 户 提 交 了 一 个 要 处 理 的 作业 时 ， 操 作 系 统 生成 一 个 进程 ， 即 为 它 分 配 一 个 新 的 
PCB， 并 把 它 加 入 等 待 CPU 时 间 的 进程 队列 。 它 把 程序 装载 到 主 存 ， 并 把 PCB 中 PC 的 副 
本 设置 为 进程 的 第 一 条 指令 的 地 址 。 这 样 作 业 就 在 准备 好 (ready) 状态 中 了 。 

操作 系统 最 终 会 让 该 作业 得 到 一 些 处 理 时 间 。 在 时 间 片 之 后 设置 闹钟 来 产生 中 断 ， 把 寄 
存 器 副本 从 PCB BLA CPU。 这 样 作 业 就 在 运行 状态 中 了 。 

在 运行 状态 中 时 ， 可 能 会 发 生 3 类 事件 ; 1 ) 当 闹 钟 中 断 时 ， 如 果 运 行 的 进程 仍然 在 执 
行 ， 就 会 超时 。 如 果 这 样 ， 操 作 系统 就 把 这 个 进程 的 PCB 放 人 准备 好 队列 中 ， 进 程 也 就 再 
次 进入 准备 好 状态 。2 ) 进程 可 能 正常 完成 它 的 执行 ， 这 种 情况 下 ， 它 执行 的 最 后 一 条 指令 
是 SVC， 请 求 操作 系统 终止 这 个 进程 。3 ) 进程 可 能 需要 某 种 输入 ， 这 种 情况 下 它 执行 SVC 
进行 请 求 ， 操 作 系 统 会 把 这 个 请 求 转 给 适当 的 IO 设备 ， 并 把 PCB 放 人 另 一 个 进程 队列 中 ， 
即 等 待 O 操作 完成 的 队列 。 这 样 进程 就 在 等 待 VO 状态 中 了 。 

进程 在 等 待 VO 状态 中 时 ，1/O 设备 最 终 会 用 所 请 求 的 输入 来 中 断 系统 。 此 时 系统 把 输 
入 放 在 内 存 的 缓冲 区 中 ， 把 进程 的 PCB 从 等 待 IO 队列 删除 ， 并 放 人 准备 好 队列 。 这 样 进 
程 就 在 准备 好 状态 中 了 ， 在 这 个 队列 中 进程 最 后 将 得 到 更 多 的 CPU 时 间 ， 那 时 进程 就 可 以 
访问 缓冲 区 中 的 输入 了 。 


8.3.3 多 处 理 


对 用 户 而 言 ， 作 业 只 是 从 开始 执行 到 结束 。 中 断 对 用 户 而 言 是 不 可 见 的 ， 就 像 DECI 中 
断 对 Asmb5 层 的 汇编 语言 程序 员 不 可 见 一 样 。 操 作 系统 层 的 细节 对 更 高 抽象 层 的 用 户 是 不 
可 见 的 。 

用 户 唯 一 可 以 感受 到 的 不 同 是 ， 如 果 系 统 中 有 很 多 作业 ， 那 么 执行 该 程序 将 会 伦 更 长 的 
时 间 。 提 高 速度 的 一 种 方法 是 给 系统 配备 不 止 一 个 CPU， 多核 芯片 中 每 一 个 核 都 是 一 个 独 
立 的 CPU， 这 样 的 配置 叫 作 多 处 理 系统 (multiprocessing system)。 图 8-20 展示 了 一 个 有 两 
个 处 理 器 的 多 处 理 系 统 。 

在 多 处 理 中 ， 因 为 CPU 在 进程 间 的 切换 非常 迅速 ， 所 以 看 上 去 就 像 它 们 在 并 发 地 执行 
一 样 。 操 作 系 统 在 多 处 理 中 可 以 调度 不 止 一 个 进程 来 并 发 执行 ， 因 为 有 多 个 处 理 器 。 

如 果 性 能 的 提高 能 够 正比 于 系统 中 处 理 器 数量 的 增加 ， 那 就 好 了 。 遗 憾 的 是 ， 通 常 实 
际 情况 并 不 是 这 样 。 当 给 系统 增加 更 多 的 处 理 器 时 ， 也 对 系统 的 通信 链 路 增加 了 更 多 的 要 
求 。 例 如 ， 如 果 把 处 理 器 连接 到 图 8-20 所 示 的 公共 总 线 上 ， 那 么 总 线 可 能 会 限制 系统 的 性 
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能 。 如 果 两 个 CPU 同时 请 求 从 输入 设备 读 信 ,那么 其 中 一 个 CPU 将 不 得 不 等 待 。 增 加 越 多 


的 CPU， 就 会 越 频繁 地 发 生 这 样 的 冲突 。 


CPU CPU 
1 2 主 存 


系统 总 线 


图 8-20 ”多 处 理 系统 框图 505 


多 处 理 器 系统 中 固有 的 通信 开销 
通常 会 导致 图 8-21 所 示 的 性 能 曲线 。 
虚线 说 明理 论 上 增加 处 理 器 能 产生 的 
最 大 好 处 。 比 如 ， 对 虚线 而 言 ， 如 果 
将 处 理 器 数量 加 倍 ， 则 性 能 也 应 翻 倍 ， 
但 实际 上 性 能 不 会 提升 那么 多 。 


8.3.4 并 发 处 理 程序 


到 目前 为 止 ， 我 们 考虑 的 所 有 进 
程 都 是 相互 独立 的 ， 每 个 进程 属于 不 
同 的 用 户 ， 并 且 进 程 之 间 没 有 交互 。 
在 这 种 情况 下 ， 计 算 结 果 不 受 中 断 发 
生 时 间 的 影响 ， 中 断 唯一 的 影响 是 增 
加 进程 执行 的 总 时 间 。 

实际 上 ， 操 作 系 统管 理 的 进程 通 
党 需 要 和 其 他 进程 合作 来 执行 它们 的 
任务 。 图 8-22 中 的 程序 描述 了 两 个 必 
须 合作 以 避免 产生 错误 结果 的 进程 的 
情况 。 

假设 操作 系统 要 管理 一 个 航空 线 
路 的 数据 库 ， 这 个 数据 库 的 记录 会 同 
时 被 多 个 用 户 访问 。 每 个 航班 在 数据 
库 中 有 一 条 记录 ， 除 了 其 他 一 些 信息 
之 外 ， 该 记录 还 包括 这 个 航班 已 经 被 
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图 8-21 通过 增加 多 处 理 系统 中 的 处 理 器 数量 来 提升 性 能 


C 语言 层 
进程 P1 进程 P2 
numRes++ numRes++ 
汇编 层 


进程 P1 进程 P2 
LDWA numRes,d 
ADDA 1,i 

STWA numRes,d 


LDWA numRes,d 
ADDA 1,i 
STWA numRes,d 


图 8-22 ”两 个 抽象 层次 上 的 并 发 进程 


预订 出 去 的 座位 数量 。 分 布 在 城市 中 的 多 家 旅行 社 代 理会 代表 可 能 的 用 户 访问 该 系统 。 因 为 
不 可 能 预测 某 个 旅行 社 代理 何 时 需要 访问 该 系统 ， 所 以 对 数据 库 信 息 的 请 求 从 某 种 程度 上 说 


是 随机 的 。 


某 天 ， 两 个 不 同 代理 的 客户 正好 同时 想 预 订 相 同 的 航班 。 操 作 系统 给 每 个 作业 创建 一 个 
VERE, AYE Pl 和 了 P2， 图 8-22 展示 了 每 个 进程 的 代码 片段 。numRes 代表 预订 出 去 的 数量 ， 
当 Pl 和 P2 在 系统 里 执行 时 ， 它 是 一 个 整 型 变量 ， 值 放 在 主 存 中 。 
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假设 两 家 代理 在 给 他 们 的 客户 预订 之 前 numRes 的 值 是 47， 交 易 完 成 后 ，numRes 应 该 
是 49。 在 C 语 言 屋 ， 每 个 进程 想 用 赋值 语句 numRes++ 把 numRes 增加 1。 如 果 赋 值 语句 
是 原子 的 ( atomic)， 即 不 能 分 割 的 ， 那 么 不 管 哪个 进程 先 执行 赋值 语句 ，C 语言 层 的 代码 片 
段 都 将 会 产生 正确 的 结果 。 如 果 PL 先 执 行 ， 它 将 使 numRes 变 为 48，P2 将 使 numRes 变 为 
49; 如 果 P2 先 执 行 ， 它 将 使 numRes 变 为 48，P1 将 使 numRes 变 为 49。 不 管 哪 种 情况 ， 都 
会 得 到 正确 的 值 49。 

问题 是 ，C 语言 层 的 赋值 语句 不 是 原子 的 ， 它 们 被 编译 成 LDWA、ADDA 和 STWA, 在 
一 个 任何 汇编 语言 语句 之 间 都 有 可 能 
发 生 中 断 的 系统 中 执行 。 图 8-23 展示 
了 一 个 执行 序列 的 跟踪 记录 ， 可 以 看 S : bien rose 
到 什么 会 出 错 。A (P1) 是 Pl 累加 器 4 “i 





的 内 容 ， 当 Pl 运行 时 它 在 CPU 中 ， (PI) LDWA numRes,d — 47 ? 47 
当 P1 暂 停 时 它 在 PCB 中 。A (P2) (P1) ADDA 1,4 48 ? 47 
是 P2 的 累加 占 。 (P2) LDWA numRes,d a 
在 这 个 序列 中 ,Pl 执行 LDWA， (P2) ADDA 1,3 48 48 47 

累加 器 增加 到 48， 然 后 操作 系统 中 断 
(P1) STWA numRes,d 48 48 48 


Pl 将 处 理 器 时 间 给 P2。P2 执行 它 的 

所 有 3 条 语句 ， 将 内 存 中 的 numRes 图 8-23 图 8-22 序列 的 一 种 可 能 的 执行 跟踪 记录 
改 为 48。 当 P1 终 于 又 继续 执行 时 ， 

它 也 将 numRes 设 为 48。 尽 管 每 个 进程 都 执行 了 它 所 有 的 语句 ， 但 最 终结 果 是 numRes 为 48 而 
不 是 49。 

不 管 进程 是 在 真正 的 并 发 多 处 理 系 统 中 ， 还 是 在 貌似 并 发 的 多 道 程序 系统 中 执行 ， 都 
会 发 生 这 种 问题 。 在 多 处 理 系 统 中 ，P1 和 P2 有 可 能 正好 同时 执行 ADDA 语句 ， 但 是 如 果 
它们 想 同时 执行 STWA 语句 ， 当 一 个 进程 在 向 内 存 写 人 值 时 ， 硬 件 会 强制 另 一 个 进程 等 待 。 
从 逻辑 的 角度 来 看 ， 不 管 并 发 是 真 的 还 是 假 的 ， 这 种 问题 都 会 发 生 。 


8.3.5 ”临界 区 


问题 的 根本 原因 是 P1 和 P2 共享 部 分 主 存 ， 这 部 分 包含 numRes 的 值 。 无 论 何 时 并 发 进 
程 共享 一 个 变量 ， 总 是 有 这 种 可 能 : 结果 取决 于 中 断 发 生 的 时 间 。 要 解决 这 个 问题 ， 我 们 就 
需要 有 一 种 方法 来 确保 当 一 个 进程 访问 共享 变量 时 ， 另 一 个 进程 不 能 进行 访问 ， 要 一 直 等 到 
第 一 个 进程 结束 访问 后 才 可 以 。 

两 个 进程 中 互 斥 的 代码 叫 作 临界 区 (critical section)。 为 了 使 并 发 程序 能 够 正确 执行 ， 
软件 必须 保证 如 果 一 个 进程 正在 执行 它 临界 区 中 的 语句 ， 那 么 另 一 个 进程 不 能 执行 它 临 界 区 
中 的 语句 。 为 了 解决 图 8-22 中 的 问题 ， 我 们 需要 找到 一 种 方法 ， 把 赋值 语句 放 到 临界 区 中 ， 
这 样 在 汇编 层 就 不 会 发 生 交错 执行 了 。 

临界 区 需要 两 段 额外 的 代码 ， 叫 作 入 口 段 (entry section) 和 出 口 段 (exit section). P1 
的 人 口 段 正好 在 它 的 临界 区 前 面 ， 它 的 功能 是 测试 P2 是 否 正 在 执行 它 的 临界 区 ， 如 果 是 ， 
就 推迟 Pl 临界 区 的 执行 直到 P2 完成 执行 它 的 临界 区 。P1 的 出 口 段 正 好 在 它 的 临界 区 后 面 ， 
它 的 功能 是 告知 P2，P1 已 经 不 在 临界 区 ， 这 样 P2 就 可 以 进入 它 的 临界 区 了 。 
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图 8-22 中 每 个 进程 的 C 语言 层 代 码 片段 都 必须 按照 如 下 进行 修改 : 
其 余部 分 

ro 

numRes++ // 临界 区 

出 口 段 

其 余部 分 


其 余部 分 是 代码 中 可 以 和 其 他 进程 一 起 并 发 执行 且 不 会 有 错误 影响 的 部 分 ， 而 临界 区 是 
代码 中 必须 互 斥 的 部 分 。 


下 面 的 一 些 程序 展示 了 入 口 段 和 出 进程 P1 进程 P2 
口 段 的 实现 ， 它 们 保护 进程 对 临界 区 的 do do 
soe IN 、 entry section entry section 
vi HE ka 程序 假设 Pl 和 P2 是 图 8-24 critical section critical section 
那 样 的 通 用 格式 ò exit section exit section 


done! 和 done2 是 在 其 余部 分 某 外 ie tidus py 
被 修改 的 ( 非 共享 的 ) 局 部 布尔 变量 。 - - 


8.3.6 ”第 一 次 尝试 实现 互 斥 
图 8-25 的 程序 是 我 们 第 一 次 尝试 设计 入 口 段 和 出 口 段 ， 它 使 用 turn 这 个 共享 整 型 变 


量 。 入 口 段 由 do 循环 组 成 ， 它 检测 
turn 的 值 ; 出 口 段 由 赋值 语句 组 成 ， 它 





图 8-24 ”临界 区 程序 的 通用 格式 





修改 turn 的 值 。 尽 管 这 里 的 代码 没有 给 进程 P1 进程 P2 
三 本、 x. y Z ate do do 
出 来 ， 但 是 假设 在 进程 进入 do 循环 前 while (turn != 1) while (turn != 2) 
turn 被 初 始 化 为 1 或 Ds ; //nothing ; //nothing 
入 口 段 中 的 do 循环 体 是 一 个 空 eins cmap 
语句 ， 它 在 汇编 层 不 会 生成 代码 。 P1 的 remainder section remainder section 
人 口 段 代码 被 翻译 成 while (!donel) ; while (!done2) ; 
Loop: LDWA turn,d 图 8-25 编程 实现 互 斥 的 一 次 尝试 
CPWA 1,i 
BRNE Loop 


假定 turn 被 初始 化 为 1， 两 个 进程 同时 尝试 进入 它们 的 临界 区 。 不 管 怎样 交错 执行 入 口 
段 中 的 汇编 语句 ，P2 会 持续 循环 ， 直 到 P1 进入 它 的 临界 区 。 当 P1 完成 它 的 临界 区 ， 它 的 
出 口 段 将 把 tun 设置 为 2， 这 之 后 P2 就 能 够 进入 它 的 临界 区 了 。 

这 个 算法 保证 临界 区 是 互 斥 的 。 只 有 当 tun 是 2 时 ，P2 才能 在 它 的 临界 区 中 ， 在 此 期 
H P1 不 能 在 它 的 临界 区 中 ， 反 之 亦 然 。 当 P2 离开 它 的 临界 区 后 ， 将 tun 置 为 1， 这 是 P1 
可 以 进入 临界 区 的 信和 号。 

尽管 这 个 算法 保证 了 互 斥 ， 但 是 它 也 要 求 进程 严格 交替 执行 它们 的 do 循环 ， 这 可 不 太 
好 。 进 程 通 过 共享 变量 turn 进行 通信 ， 它 一 直 记 录 着 谁 该 执行 它 的 临界 区 。 如 果 用 户 想 让 
Pl 执行 数 次 do 循环 而 P2 根本 不 执行 ,那么 使 用 这 样 的 入口 段 和 出 口 段 ， 这 种 情况 是 绝对 
不 会 发 生 的 。 


8.3.7 ”第 二 次 尝试 实现 互 斥 
为 了 使 一 个 进程 能 够 执行 它 的 do 循环 而 不 受 男 一 个 进程 执行 的 限制 (除去 为 了 满足 互 矿 
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的 要 求 )， 图 8-26 的 程序 使 用 了 两 个 共享 布尔 变量 enterl 和 enter2， 假 设 enter! 和 enter2 都 
初始 化 为 false。 
如 果 P2 在 它 的 其 余部 分 ，enter2 一 定 为 





it n Shane i 进程 P1 进程 P2 
假 ， 那 么 Pl 就 可 以 想 执行 它 的 do 循环 多 少 aes ae 
次 就 执行 多 少 次 。 它 只 需要 将 enterl 设置 为 enterl = TRUE; enter2 = TRUE; 
true, 在 while 循环 中 测试 enter2 =, 执行 while (enter2) while (enter1l) 
4 as ae ; //nothing ; //nothing 
它 的 临界 区 , 将 enterl 设置 为 false， 执行 6 critical section critical section 
的 其 余部 分 。 它 可 以 想 怎么 重复 这 个 循环 就 enteri FALSE: enter? ~ FALSE; 
p a remainder section remainder section 
人 怎么 重复 。 类 似 地 ， 如 果 Pi 在 它 的 其 余部 while (!donel) ; while (!done2) ; 
分 ，P2 也 可 以 重复 它 的 这 个 循环 。 一 一 
这 样 的 实现 保证 了 互 斥 。 当 P1 把 enterl 图 8.26 SEA -KEM 


设置 为 true 时 ， 就 是 给 P2 发 信号 告诉 它 正 
在 尝试 进入 临界 区 。 如 果 P2 正好 在 稍 早 一 点 的 时 候 在 它 的 while 测试 中 用 
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获取 了 enterl, MAP2 不 会 立即 知道 Pl1 的 目的 ，P2 可 能 已 经 在 执行 它 的 临界 区 了 。 不 
管 怎 样 ， 如 果 P2 在 它 的 临界 区 中 , 那么 enter2 必定 为 ttue，P1 的 while 循环 将 阻止 P1 同时 
也 进入 它 的 临界 区 。 当 P2 最 终 退 出 时 ， 它 把 enter2 设置 为 假 ， 这 样 就 允许 P1 进入 它 的 临 
界 区 。 

协同 执行 进程 的 设计 者 面临 的 问题 可 能 是 非常 微妙 和 意 想不到 的 ， 这 个 算法 就 是 一 个 这 
样 的 例子 。 尽 管 它 像 前 面 的 程序 一 样 ， 保 证 互 斥 而 且 不 限制 do 循环 的 执行 ， 但 是 它 仍然 有 
一 个 严重 的 漏洞 。 

图 8-27 展示 了 一 个 跟踪 记录 ，P1 设置 
enterl 为 true， 然 后 遇 到 中 断 。P2 设置 enter2 








为 true， 然 后 开始 执行 它 的 while 循环 。 因 为 NS 
enterl 为 true， 所 以 while 循环 将 继续 执行 一 人 Es 
直到 P2 超时 ，P1 恢复 。 因 为 enter2 为 true， (P2)enter2 = TRUE; true true 
所 以 P1 也 将 会 无 限 地 循环 。 (Pawhile (enteri); mete 
P1 All P2 两 个 进程 都 处 于 想 进 入 临界 区 (P1)while (enter2) ; true true 


的 状态 。P1 要 等 到 P2 进入 执行 它 的 临界 区 
将 enter2 设置 为 false 才能 进入 ,但 是 P2 要 
等 到 Pl 进入 执行 它 的 临界 区 将 enterl 设置 
为 false 才能 进入 。 两 个 进程 都 在 等 待 永远 不 
会 出 现 的 事件 ， 这 种 局 面 叫 作 死 锁 (deadlock)。 死 锁 就 像 死 循环 ， 要 避免 出 现 这 种 情况 。 


8.3.8 Peterson 互 斥 算法 

我 们 需要 一 种 解决 方法 ， 它 保证 互 斥 ， 允 许 每 个 进程 外 面 的 do 循环 无 限制 地 执行 ， 并 
且 避 免 死 锁 的 出 现 。 图 8-28 是 Peterson 算法 的 实现 ， 它 结合 图 8-25 和 图 8-26 的 特性 来 实 
现 所 有 的 目标 ， 甚 基本 思路 是 enterl 和 enter2 提供 如 图 8-26 那样 的 互 斥 ， 即 使 在 同一 时 间 
两 个 进程 都 想 进 入 临界 区 ，turn 也 只 允许 一 个 进入 。enterl 和 enter2 初始 为 false，turn 初始 
为 1 或 者 2。 


8-27 图 8-26 所 示 程 序 的 一 个 会 产生 死 锁 的 
跟踪 记录 
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进程 P1 进程 P2 
do do 
enterl = TRUE; enter2 = TRUE; 
turn = 2; turn = Lz 
while (enter2 && (turn == 2)) while (enterl && (turn == 1)) 


; //nothing ; //nothing 
critical section critical section 
enterl = FALSE; enter2 = FALSE; 
remainder section remainder section 
while (!donel) ; while (!done2) ; 





图 8-28 Peterson 互 斥 算法 


我 们 来 看 一 看 互 斥 是 如 何 保证 的 。 考 虑 P1 和 P2 同时 执行 它们 的 临界 区 的 情况 ，enterl 
和 enter2 都 将 为 true。 在 Pl 中 ，while 测试 意味 着 turn 的 值 为 1， 因为 enter2 为 true。 但 在 
P2 中 ，while 测试 意味 着 turn 的 值 为 2， 因 为 enterl 为 true。 这 个 矛盾 表明 Pl 和 了 2 不 可 能 
同时 执行 它们 的 临界 区 。 

但 如 果 Pl Al P2 想 同 时 进入 它们 的 临界 区 会 怎样 呢 ? 在 入 口 段 有 一 些 交错 执行 会 导致 
它们 同时 执行 临界 区 吗 ? 答案 是 不 会 ， 即 使 有 AND 运算 的 while 测试 在 汇编 层 不 是 原子 的 。 


有 两 个 条 件 可 以 使 Pl 通过 while 测试 进入 它 的 临界 区 : enter2 为 false 或 者 turn 为 1。 如 果 


任 一 条 件 满足 ， 不 管 男 一 个 条 件 如 何 ，P1 都 可 以 进入 临界 区 。 
假设 Pl 通过 while 测试 ， 因 为 它 用 
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获得 enter2 的 值 ，enter2 MAW false, HA P2 在 它 的 其 余部 分 时 ， 这 才 会 发 生 。 即 使 P1 
在 装载 enter2 的 值 后 被 中 断 ， 然 后 P2 设置 enter2 X true, turn 为 1，P2 也 不 能 进入 它 的 临 
FLX, AA Pl 已 经 设置 enterl X true H. turn 现在 为 1。 

假设 P1 通过 while 测试 ， 因 为 它 用 

LDWA turn,d 


获得 turn 的 值 ，turn 的 值 为 1。 因 为 Pl 前 面 的 指令 把 turn 设置 为 2， 只 有 了 1 在 它 的 前 一 条 
指令 和 while 测试 之 间 被 中 断 ， 且 P2 tum 设 为 1 时 ， 才 可 能 出 现 这 种 情况 。 但 是 接着 ， 
P2 又 将 被 阻止 通过 它 的 while 循环 进入 临界 区 ， 因 为 P1 已 经 设置 enterl YHA turn 现在 的 
值 为 1。 

我 们 来 看 一 看 为 什么 不 会 发 生死 锁 。 假 设 两 个 进程 都 陷 人 死 锁 ，( 在 多 处 理 系统 中 ) 并 
行 或 (在 多 道 程序 系统 中 ) 在 不 同 的 时 间 片 中 执行 它们 的 while 循环 。P1 中 的 while 测试 意 
味 着 turn 的 值 必须 为 2， 但 是 P2 中 的 while 测试 意味 着 turn 的 值 必须 为 1。 这 个 矛盾 的 情 
况 表 明 两 个 进程 不 可 能 同时 都 在 循环 。 

假设 两 个 进程 同时 都 想 用 
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设置 turn。 在 多 道 程序 设计 系统 中 ， 因 为 必须 在 不 同 的 时 间 片 中 执行 ， 所 以 Pl 给 turn 的 赋 
值 一 定 会 发 生 在 P2 的 赋值 之 前 或 者 之 后 。 在 多 处 理 系 统 中 ， 如 果 两 个 进程 正好 同时 都 想 在 
主 存 中 给 turn 赋值 ， 那 么 当 其 中 一 个 进程 执行 STWA 时 硬件 会 强制 另 一 个 进程 等 待 。 在 两 
种 系统 中 ， 先 给 turn 赋值 的 进程 将 进入 它 的 临界 区 ， 这样 就 不 会 发 生死 锁 。 
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8.3.9 信号 量 


尽管 图 8-28 中 的 程序 解决 了 临界 区 问题 并 避免 出 现 死 锁 ， 但 是 它 的 缺点 是 效率 低 。 阻 
止 进程 进入 临界 区 的 是 while 循环 ， 循 环 的 唯一 目的 是 拖延 进程 直到 它 被 中 断 ， 给 另 一 个 进 
程 时 间 去 完成 执行 它 的 临界 区 。 因 为 进程 以 循环 的 方式 被 锁 在 自己 的 临界 区 之 外 ， 所 以 这 样 
的 循环 叫 作 旋 转 锁 (spin lock). 

旋转 锁 是 对 CPU 时 间 的 浪费 ， 尤 其 是 如 果 进 程 在 多 道 程 序 设计 系统 中 执行 ， 并 被 分 配 
一 个 新 的 时 间 片 。 如 果 把 这 个 CPU 时 间 分 配给 另 一 个 进程 执行 一 些 有 用 的 工作 ， 那 就 会 更 
有 效率 。 信 号 量 (semaphore) 是 大 多 数 操作 系统 都 提供 的 用 以 并 发 编程 的 共享 变量 ， 它 们 可 
以 让 程序 员 不 用 旋转 锁 来 实施 临界 区 。 

信和 号 量 是 一 个 整数 型 变量 ， 它 的 值 只 能 由 操作 系统 调用 来 修改 。 对 信和 号 量 s 的 3 个 操 
作 是 

è init(s) 

è wait(s) 

® signal(s) 

这 里 init()、wait() 和 signal) 是 操作 系统 提供 的 过 程 。 在 汇编 层 ， 用 带 有 适当 操作 数 指 
示 符 的 SVC 来 调用 这 些 过 程 。 信 和 号 量 是 带 操作 的 抽象 数据 类 型 (ADT) 的 又 一 个 例子 ， 它 
的 含义 程序 员 是 知道 的 ， 但 它 的 实现 隐藏 在 更 低 的 抽象 层 中 。( wait(s) 和 signal(s) 通常 又 分 
别 写 作 p(s) 和 v(s)。) 

每 个 信号 量 s 有 一 个 关联 的 进程 控制 块 队列 ， 叫 作 sQueue， 它 代表 被 暂停 的 进程 。 这 
几 个 操作 的 含义 是 

init (s) 

s= 1; 

sQueue = an empty list of process control blocks 

wait (s) 

ma 


if (s < 0) 
Suspend this process by adding it to sQueue 


signal (s) 

S++ 

if (s < 0) 

Transfer a process from sQueue to the ready queue 

每 个 操作 都 有 一 个 重要 的 特性 ， 那 就 是 操作 系统 保证 它们 是 原子 的 。 例 如 ， 不 可 能 两 个 
进程 同时 执行 signal(s)， 而 s 只 增加 了 1， 像 图 8-22 中 的 numRes 那样 。 汇 编 层 的 赋值 语句 
绝 不 会 交叉 执行 。 

图 8-29 是 提供 信号 量 的 操作 系统 中 作业 的 状态 转换 图 。 与 处 于 准备 好 状态 的 进程 是 暂 
停 的 ， 它 的 PCB 是 在 准备 好 队列 中 一 样 ， 处 于 等 待 s 状态 的 进程 是 暂停 的 ， 它 的 PCB 在 
sQueue 中 。 这 样 的 进程 被 阻止 运行 ， 因 为 它 必 须 转 换 到 准备 好 状态 才能 执行 。 

如 果 一 个 正在 运行 的 进程 执行 wait(s)， 当 s 大 于 0 时 ，wait(s) 只 是 将 s 减 1， 进程 继续 
执行 ; 当 s 小 于 等 于 0 时， 正在 运行 的 进程 通过 执行 wait(s) 会 转换 到 等 待 s 状态 。 当 s 大 于 
等 于 0 时 ， 一 个 正在 运行 的 进程 执行 signal(s)， 它 只 是 将 s 加 1， 进 程 继续 执行 ; 当 s 小 于 0 
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时 ， 正 在 执行 signal(s) 的 进程 会 引发 某 个 正在 等 待 s 的 进程 被 操作 系统 挑选 出 来 放 到 准备 好 
状态 中 。 执 行 signal(s) 的 进程 继续 运行 。 






创建 进程 超时 


图 8-29 提供 信号 量 的 操作 系统 中 作业 的 状态 转换 图 


从 wait() 和 signal() 的 定义 来 说 ，s 为 负 值 表示 一 个 或 多 个 进程 被 阻塞 在 sQueue 中 , 而 s 
的 数值 就 是 被 阻塞 进程 的 数量 。 例 如 ， 如 果 s 值 为 -3 ， 那 么 就 有 3 个 进程 阻塞 在 SQueue 中 。 
signal(s) 执行 时 ， 如 果 有 多 于 一 个 进程 被 阻塞 ， 那 么 操作 系统 尽力 在 选择 进程 转移 到 准 
备 好 状态 这 件 事情 上 保持 公平 。 通 用 的 策略 是 使 用 先进 先 出 〈First In, First Out, FIFO) 的 
调度 策略 ， 这 样 阻 塞 时 间 最 长 的 进程 会 被 送 到 准备 好 状态 。FIFO 是 队列 区 别 于 栈 的 特性 ， 
栈 是 后 进 先 出 (Last In, First Out, LIFO). 
图 8-29 仅 展示 了 一 个 信号 量 等 待 状态 。 在 提供 信和 号 量 的 系统 中 ， 程 序 员 可 以 想 声明 多 [515 
少 个 就 声明 多 少 个 不 同 的 信号 量 ， 操 作 系统 会 为 每 个 信号 量 维护 一 个 阻塞 进程 队列 。 


8.3.10” 带 信号 量 的 临界 区 


wait (s) 


如 果 操作 系统 提供 信号 量 ， 那 么 对 程序 | BET 
来 说 临界 区 就 很 容易 了 。 8-30 的 程序 假 wait (mutEx) ; wait (mutEx) ; 
设 mutEx 是 和 AF 用 init(mutEx) 初 始 化 为 1 critical section critical section 
fia . signal (mutEx) ; signal (mutEx) ; 
ee e 行 ; remainder section remainder section 
第 一 个 执行 wait(mutEx) 的 进程 将 把 while (!donel); while (!done2) ; 





mutEx 从 1 变 为 0， 并 进入 它 的 临界 区 。 如 
果 其 他 进程 在 此 期 间 执行 wait(mutEx)， 那 
么 将 把 mutEx 由 0 变 为 -1， 操作 系统 将 立 
即 阻塞 它 。 当 第 一 个 进程 最 终 离开 它 的 临界 区 时 ， 将 执行 signal(mutEx)， 这 将 把 另 一 个 进 
程 放 入 准备 好 状态 中 。 

由 于 操作 系统 保证 wait() 和 signal() 是 原子 的 ， 所 以 程序 员 不 需要 担心 在 人 口 段 和 出 口 
段 中 的 操作 交错 执行 。 因 为 系统 会 立即 把 第 二 个 进程 放 在 mutEx 的 等 待 队 列 中， 所 以 也 不 
会 在 旋转 锁 上 浪费 时 间 。 当 然 ， 隐 藏 细节 并 不 是 消除 细节 。 要 提供 信号 量 ， 操 作 系统 设计 者 
必须 利用 硬件 的 特性 ， 还 要 使 用 和 前 面 程序 中 一 样 的 算法 推理 思路 。 信 号 量 可 以 满足 操作 系 
统 的 两 个 目标 : 为 高 级 编程 提供 方便 的 环境 ; 高 效 地 分 配 系统 资源 。 


8.4 Wi 
图 8-26 中 的 程序 展示 了 并 发 处 理 如 何在 共享 主 存 变量 的 两 个 进程 之 间 产 生死 锁 。 当 进 


图 8-30 带 信号 量 的 临界 区 
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程 共享 其 他 资源 时 也 可 能 会 发 生死 锁 。 操 作 系统 管理 的 资源 包括 打印 机 和 磁盘 文件 。 并 发 进 
程 共享 这 些 资源 中 的 任意 之 一 都 有 可 能 导致 死 锁 。 

举 一 个 共享 这 些 资 源 导致 死 锁 的 例子 。 假 设计 算 机 系统 有 一 个 带 有 两 个 文件 的 硬盘 驱 
hat, VERE Pl 请 求 文件 1 进行 数据 输入 。 操 作 系 统 为 Pl 打开 文件 1，P1 将 占用 这 个 文件 
直到 不 再 需要 它 为 止 。 然 后 ，P2 可 以 请 求 从 文件 2 输入， 操作 系统 打开 文件 2 并 分 配给 该 
进程 。 

现在 假设 P1 需要 向 P2 正在 访问 的 文件 2 写 人 数据 。P1 请 求 访问 文件 2， 但 操作 系统 
不 能 满足 这 个 请 求 ， 因 为 该 文件 已 经 为 P2 打开 了 。 操 作 系统 会 阻塞 P1， 直 到 文件 2 变 为 可 
用 。 同 样 ， 如 果 P2 请 求 写 文件 1， 操 作 系 统 也 会 阻塞 它 ， 直 到 Pl 释放 该 文件 。 

在 这 种 情况 下 ， 进 程 就 处 于 死 锁 的 状态 。P1 不 能 前 进 直 到 P2 释放 文件 2 为 止 ，P2 不 
能 前 进 直 到 Pl 释放 文件 1 为 止 。 两 个 进程 都 在 等 待 一 个 不 可 能 发 生 的 事件 ， 将 被 操作 系统 
暂停 。 


8.4.1 资源 分 配 图 


为 了 有 效 地 管理 资源 ， 操 作 系统 需要 一 种 方式 来 发 现 可 能 的 死 锁 。 它 采用 了 一 种 称 为 资 
源 分 配 图 (resource allocation graph) 的 结构 。 资 源 分 配 图 是 系统 中 进程 和 资源 的 图 形 化 描 
述 ， 展 示 了 哪个 资源 分 配给 了 哪个 进程 ， 哪 个 进程 阻塞 在 了 对 哪个 资源 的 请 求 上 。 

图 8-31 中 的 资源 分 配 图 就 是 Pl 和 P2 由 于 对 磁盘 文 


件 1 和 磁盘 文件 2 的 请 求 形成 了 死 锁 。 进 程 和 资源 是 图 磁盘 文件 1 

中 的 结 点 ， 进 程 用 圆圈 表示 ， 资 源 是 方 框 里 的 实心 圆 点 。 Ri 

有 两 种 类 型 的 边 : 分 配 边 和 请 求 边 。 a! es 
分 配 边 (allocation edge, al) 是 从 资源 到 进程 ， 表 D O 

示 该 资源 分 配给 了 该 进程 。 在 图 中 ,标记 为 al 的 从 磁盘 

文件 1 到 P1 的 边 的 含义 是 操作 系统 把 文件 1 分 配给 了 进 a a 

FE PI, Rix (request edge, req) 是 从 进程 到 资源 ， 意 R2 

思 是 进程 被 阻塞 了 ， 正 在 等 待 该 资源 。 标 记 为 req 的 从 磁盘 文件 2 


P2 到 文件 1 的 边 的 含义 是 P2 被 阻塞 在 了 对 磁盘 文件 1 图 8-31 有 死 锁 循环 的 资源 分 配 图 
的 等 待 上 。 

边 组 成 了 一 个 闭合 的 路 径 ， 从 P1 到 R2 到 P2 到 R1 再 回 到 P1， 死 锁 就 很 明显 地 能 看 出 
来 。 图 中 这 样 的 一 个 闭合 路 径 称 为 循环 (cycle)。 资 源 分 配 图 中 的 循环 表明 一 个 进程 阻塞 在 
一 个 资源 上 ， 因 为 该 资源 分 配给 了 男 一 个 进程 ， 而 它 阻塞 在 另 一 个 资源 上 ， 以 此 类 推 ， 最 后 
一 个 资源 分 配给 了 第 一 个 进程 。 如 果 循 环 不 能 被 打破 ， 就 出 现 了 死 锁 。 

有 时 一 类 中 的 资源 是 不 做 区 分 的 ， 进 程 可 以 请 求 某 类 资源 中 的 一 个 ， 而 不 关心 具体 是 哪 
一 个 ， 因 为 资源 都 是 等 价 的 。 比 如 ， 有 一 组 相同 的 硬盘 驱动 器 ， 或 者 一 组 相同 的 打印 机 。 如 
果 进 程 需要 一 个 打印 机 而 不 在 意 是 其 中 的 哪 一 个 ， 那 么 操作 系统 就 可 以 把 任意 一 个 空闲 的 打 
印 机 分 配给 它 。 

资源 分 配 图 用 长 方形 方 框 中 的 n 个 实心 点 表示 同一 类 n 个 等 价 的 资源 。 当 操作 系统 分 配 
一 个 该 类 资源 时 ,分配 边 从 代表 一 个 资源 的 某 个 点 发 出 。 不 过 请 求 边 指向 方 框 ， 因 为 请 求 进 
程 不 在 意 它 获 得 的 是 这 类 资源 中 的 哪 一 个 。 

图 8-32a 中 R1 资源 类 中 的 两 个 资源 都 已 经 分 配 出 去 了 ，P1 有 一 个 对 该 类 资源 未 被 满足 


的 请 求 ， 它 不 在 意 获 得 哪 一 个 资源 。 


a) 初始 状态 b) P4 完成 c) P2 完成 
图 8-32 有 循环 但 是 没有 死 锁 的 资源 分 配 图 


虽然 这 张 图 有 循环 (P1, R1, P3, R3, P1), 但 是 没有 死 锁 ， 因 为 这 个 循环 是 可 以 被 打 
人 破 的 。 资 源 分 配 图 中 任意 一 个 进程 如 果 没 有 请 求 边 ， 那 么 它 就 没有 被 阻塞 。 这 张 图 中 P4 是 
未 被 阻塞 的 ， 可 以 想象 它 最 终 会 执行 完毕 ， 释 放 R2。 操 作 系 统 会 满足 P2 对 R2 的 请 求 ， 把 
从 P2 到 R2 的 请 求 边 改 为 从 R2 到 P2 的 分 配 边 ， 如 图 8-32b 所 示 。 

现在 P2 能 够 使 用 R2 和 R1， 可 以 运行 完成 ， 最 终 释 放 这 些 资源 。 当 P2 释放 一 个 Rl 资 
源 时 ， 操 作 系 统 可 以 把 该 资源 分 配给 Pl1， 得 到 图 8-32c。P1 拥有 它 
需要 的 所 有 资源 ， 可 以 运行 完成 ， 之 后 P3 也 可 以 完成 了 。 所 有 的 进 


RI 
程 都 可 以 完成 ， 所 以 没有 死 锁 。 EA) 
在 寻找 循环 的 过 程 中 ,一 定 要 考虑 边 的 方向 。 你 可 能 会 把 i ji 


图 8-33 中 的 (R1, Pl, R2, P2, R1) 当 作 循环 ， 但 是 它 并 不 是 。 这 
里 没有 从 R2 到 P2 的 边 ， 也 没有 从 P2 到 RI 的 边 。 循 环 是 死 锁 的 必 = 
要 而 非 充分 条 件 。 在 这 张 图 中 ， 没 有 循环 ， 所 以 也 没有 死 锁 。 


8.4.2 EMEK 
操作 系统 可 以 采用 下 列 3 种 通用 策略 之 一 来 处 理 死 锁 ， 图 8-33 无 循环 因而 
e 预防 也 无 死 锁 的 
。 发现 并 恢复 i 
。 无 视 


某 个 操作 系统 中 可 能 有 多 种 不 同 的 策略 。 系 统 可 以 为 一 组 资源 使 用 一 种 策略 ， 而 为 另外 
一 组 资源 使 用 另 一 种 策略 。 

预防 策略 是 采用 技术 保证 不 会 出 现 死 锁 。 一 种 技术 是 要 求 运行 完成 所 需 的 所 有 资源 ， 在 
执行 开始 时 作业 请 求 和 分 配 一 次 完成 。 如 果 P1 同时 获得 R1 和 R2, 那么 图 8-31 中 的 死 锁 是 
不 会 产生 的 。 只 有 一 个 进程 被 分 配 了 某 个 资源 ， 然 后 又 请 求 另 外 的 资源 ， 形 成 一 个 循环 ， 才 
可 能 发 生死 锁 循 环 。 

发 现 并 恢复 策略 允许 发 生死 锁 。 采 用 这 种 策略 时 ， 操 作 系 统 将 周期 性 地 执行 一 个 检测 系 
统 中 死 锁 循环 的 程序 。 如 果 操 作 系 统 发 现 死 锁 ， 就 拿 走 循环 中 一 个 进程 所 占用 的 一 个 资源 。 
因为 进程 可 能 已 经 执行 了 一 部 分 ， 所 以 操作 系统 通常 必须 终止 该 进程 ， 除 非 稍 后 当 该 进程 再 
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获得 该 资源 时 ， 资 源 的 状态 还 能 重建 。 

所 有 这 些 策略 都 是 有 代价 的 。 预 防 策略 对 用 户 有 所 限制 ， 特 别 是 ， 当 进程 所 需 资源 依赖 
于 输入 而 无 法 事先 知道 的 时 候 。 在 发 现 并 恢复 策略 中 ， 发 现 和 恢复 算法 需要 占用 CPU 时 间 ， 
这 些 时 间 就 不 能 用 在 用 户 作 业 上 。 

第 三 种 策略 就 是 无 视 死 锁 。 如 果 认为 其 他 策略 的 代价 都 太 大 ， 而 发 生死 锁 的 概率 又 很 
小 , 或 者 出 现 死 锁 的 后 果 并 不 严重 ， 选 用 这 种 策略 就 比较 有 效率 。 例 如 ， 某 个 分 时 系统 会 定 
期 关机 进行 例 行 维护 ， 每 次 关机 时 所 有 的 作业 都 会 被 清除 ， 包 括 那 些 死 锁 的 作业 。 


本 章 小 结 


操作 系统 的 目标 是 向 高 级 编程 提供 方便 的 环境 并 高 效 地 分 配 系统 资源 。 操 作 系统 的 一 项 
重要 功能 是 管理 用 户 提交 要 执行 的 作业 。 装 载 右 是 操作 系统 的 一 部 分 ， 它 把 作业 放 入 内 存 进 
行 执行 。 在 作业 完成 执行 之 后 ， 它 把 CPU 的 控制 返回 给 操作 系统 ， 操 作 系 统 可 以 继续 加 载 
其 他 的 应 用 程序 。 

陷阱 处 理 程序 为 作业 执行 一 些 处 理 操作 ， 向 程序 员 隐藏 低层 的 细节 。 当 陷阱 发 生 时 ， 正 
在 运行 的 作业 的 进程 控制 块 (PCB ) 被 存储 起 来 ， 同 时 操作 系统 响应 并 服务 该 中 断 。PCB 由 
进程 的 状态 组 成 ， 包 括 程 序 计数 器 、 状 态 位 和 所 有 CPU 寄存 器 的 内 容 的 副本 。 要 继续 执行 
该 作业 时 ， 操 作 系统 把 PCB 放 回 CPU 中 。 异 步 中 断 的 运行 和 过 程 调用 类 似 ， 只 不 过 中 断 是 
由 井 作 系统 发 起 ， 而 不 是 由 应 用 程序 员 的 代码 发 起 。 

进程 是 执行 时 的 程序 。 在 多 道 程序 设计 系统 中 ，CPU 在 多 个 进程 间 切 换 。 在 多 处 理 系 
统 中 ， 有 不 止 一 个 CPU。 多 道 程序 设计 和 多 处 理 系统 中 都 有 并 发 执行 的 进程 。 要 并 发 地 执 
行 协作 的 进程 ， 操 作 系统 必须 能 够 保证 对 临界 区 的 互 斥 访问 ， 并 避免 死 锁 。Peterson 算法 满 
足 这 两 个 要 求 。 信 和 号 量 是 操作 系统 提供 的 整 型 变量 ， 对 它 的 操作 包括 wait() 和 signal(), ix 
些 操作 都 是 原子 的 或 者 说 是 不 可 分 割 的 。 信 和 号 量 可 以 用 来 满足 互 斥 和 不 出 现 死 锁 的 要 求 。 

当 进程 共享 操作 系统 管理 的 资源 时 ， 也 有 可 能 出 现 死 锁 。 资 源 分 配 图 由 代表 资源 和 进程 
的 结 点 组 成 ， 结 点 间 的 边 表示 资源 分 配 和 请 求 。 如 果 资 源 分 配 图 中 包含 有 不 能 被 打破 的 循 
环 ， 就 表示 发 生 了 死 锁 。 


练习 


8.15 

1. 操作 系统 的 两 大 目标 是 什么 ? 

2. 图 8-3 中 的 装载 器 执行 下 列 输入 ; 
12 00 05 00 00 31 00 03 39 00 03 DO 00 OA F1 FC 
16 49 00 15 00 54 68 61 74 27 73 20 61 6C 6C 2E 


OA 00 zz 

假设 从 FCI1A 到 FC4E 的 循环 执行 到 第 30 次 ， 以 4 个 十 六 进 制 数字 的 格式 说 明 下 列 寄存 器 中 的 值 : 
*(a) 在 F61A 的 LDBA 之 后 的 A<8..15> * (b) 在 FC2C 的 ASLA 之 前 的 A<8..15> 
*(c) 在 FC2F 的 ASLA 之 后 的 A<8..15> (d) 在 FC33 的 LDBA 之 后 的 A<8..15> 

(e) 在 FC3F 的 ANDA 之 后 的 A<8..15> (f) 在 FC42 的 ORA 之 后 的 A<8..15> 


(g) 在 FC48 的 ADDX 之 后 的 X<8..15> 
3. 对 于 循环 第 32 次 执行 时 的 情况 ， 再 做 一 遍 练习 2。 
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8.2 # 
4. 图 8-34 的 程序 执行 时 ， 产 生 一 个 DECI 中 断 。 根 据 图 8-6， 进 入 和 退出 该 陷阱 处 理 程序 ， 以 4 个 
十 六 进 制 数字 的 格式 说 明 下 列 寄 存 器 中 的 值 : 
*(a) 在 FC52 的 LDBX 之 后 的 X<8..15> (b) 在 FC69 的 ASRX ZJahy X 
(c) 在 FC6A 的 SUBX 之 后 的 X (d) 在 FC6E 的 CALL 之 后 的 PC 
(e) 在 FC71 的 RETTR 之 后 的 PC 


120005 main ;Branch around data 
0000 num: 2 ;Global variable 
310003 main: num, d ;Input decimal value 


390003 num,d ;Output decimal value 
DOOOOA Tt 
F1FC16 charOut,d ;Output message 


490015 msg,d 

00 

546861 : "That's all.\xoo" 
742773 

20616C 

6C2E00 





图 8-34 练习 4 的 程序 


*5. 对 于 DECO 指令 再 做 一 遍 练 习 4。 
*6, 对 于 STRO 指令 再 做 一 遍 练 习 4。 
7. 以 输入 37 运行 练习 4 中 的 程序 。 根 据 图 8-14 的 DECI 陷阱 处 理 程序 ， 以 4 个 十 六 进 制 数字 的 格式 
说 明 (a) ~ (h) 中 寄存 器 的 值 ， 并 回答 G) 中 的 问题 : 
*(a) 在 第 一 次 执行 FD98 的 ANDA 之 后 的 A。 
*(b) 在 第 二 次 执行 FD98 的 ANDA 之 后 的 A。 
*(c) 在 第 一 次 执行 FDA1 的 LDWX 之 后 的 义 。 
(d) 在 第 二 次 执行 FDA1 的 LDWX 之 后 的 义 。 
(e) 在 第 一 次 执行 FDA5 的 BR 之 后 的 PC. 
(£) 在 第 二 次 执行 FDA5 的 BR 之 后 的 PC。 
(g) 在 FE96 的 LDWA 之 后 的 A。 
(h) 在 执行 FEB1 AY STBX 之 前 的 XX， 假设 在 陷阱 发 生 之 前 进位 位 为 0。 
(i) 在 FE74 的 LDWA 执行 之 前 执行 的 是 什么 语句 ? 
*8, 对 于 输入 一 295 再 做 一 遍 练习 7。 
9. 以 输入 37 运行 练习 4 中 的 程序 。 根 据 图 8-15 的 DECO 陷阱 处 理 程序 ， 以 4 个 十 六 进 制 数字 的 格式 
说 明 下 述 寄 存 器 的 值 : 
*(a) 在 FE4A 的 LDWA 之 后 的 A 
*(b) 在 FFOA 的 STWA 之 前 的 A 
对 于 下 面 的 问题 ， 假 设 在 FF2B 的 CALL 调用 的 是 子 例 程 divide: 
*(c) 在 FF44 的 LDWA 之 后 的 A 
(d) 在 FF59 的 CPWX 之 前 的 
(e) 在 FF68 的 LDWA 之 后 的 A 
对 于 下 面 的 问题 ， 假 设 在 FF34 的 CALL 调用 的 是 子 例 程 divide: 
(f) 在 FF44 的 LDWA 之 后 的 A 
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(g) TE FF59 AY CPWX 之 前 的 X 
(h) 在 FF6F 的 ORX 之 后 的 X 


10. 对 于 输入 -2068 再 做 一 遍 练 习 9。 


11. 


运行 练习 4 中 的 程序 ， 执 行 STRO 指令 。 根 据 图 8-16 的 STRO 陷阱 处 理 程序 ， 以 十 六 进 制 数字 的 
格式 说 明 下 述 寄 存 器 的 值 : 

(a) 在 FFCE 的 LDWA 之 后 的 A 

(b) 在 第 一 次 执行 FFE4 的 LDBA 之 后 的 A<8..15> 

(c) 在 第 一 次 执行 FFED 的 ADDX 之 后 的 X 

(d) 在 第 5 次 执行 FFE4 的 LDBA 之 后 的 A<8..15> 

(e) 在 第 5 次 执行 FFFD 的 ADDX 之 后 的 义 


.执行 图 5-11 中 地 址 0005 处 采用 直接 寻 址 方式 的 DECI 指令 ， 产生 一 个 陷阱 ， 隐 阱 处 理 程 序 调 用 


图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数字 的 格式 说 明 变 址 寄存 器 的 值 : 
(a) 在 FCF2 的 LDWX 之 后 
(b) Æ FCF5 的 SUBX 之 后 
(c) 在 FCF8 的 LDWX 之 后 


.执行 图 6-41 中 地 址 004B 处 采用 间接 寻 址 方式 的 DECO 指令 ， 产 生 一 个 陷阱 ， 陷 阱 处 理 程序 调用 


图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数字 的 格式 说 明 变 址 寄存 器 的 值 : 
(a) 在 FCFF 的 LDWX 之 后 
(b) Æ FD02 的 SUBX 之 后 
(c) Æ FD05 的 LDWX 之 后 
(d) 在 FD08 的 LDWX 之 后 


. 执行 图 6-4 中 地 址 0009 处 采用 栈 相 对 寻 址 方式 的 DECI 指令 ， 产 生 一 个 陷阱 ， 陷 阱 处 理 程 序 调 用 


图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数字 的 格式 说 明 变 址 寄存 器 的 值 : 
(a) 在 FDOF 的 LDWX 之 后 
(b) 在 FD12 的 SUBX 之 后 
(c) 在 FD15 的 LDWX 之 后 
(d) 在 FD18 的 ADDX 之 后 


;第 二 次 执行 图 6-36 中 地 址 0013 处 采用 栈 变 址 寻 址 方式 的 DECI 指令 ,产生 一 个 陷阱 ， 陷 阱 处 理 程 


序 调用 图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数 字 的 格式 说 明 变 址 寄存 器 的 值 : 
(a) 在 FD42 的 LDWX 之 后 
(b) 在 FD45 的 SUBX 之 后 
(c) 在 FD48 的 LDWX 之 后 
(d) 在 FD4B 的 ADDX 之 后 
(e) 在 FD4E 的 ADDX 之 后 


.第 二 次 执行 图 6-38 中 地 址 0016 处 采用 栈 变 址 间接 寻 址 方式 的 DECI 指令 ， 产 生 一 个 陷阱 ， 陷 阱 处 


理 程序 调用 图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数字 的 格式 说 明 变 址 寄存 器 的 值 : 
(a) Æ FDS5 的 LDWX 之 后 

(b) Œ FD58 的 SUBX 之 后 

(c) 在 FD5B 的 LDWX 之 后 

(d) 在 FD5E 的 ADDX 之 后 

(e) 在 FD61 的 LDWX 之 后 

(f) Æ FD64 的 ADDX 之 后 


8.3 节 
17. 图 8-23 中 的 交错 执行 序列 可 以 简写 为 112221， 表 示 图 8-22 中 P1、P1、P2、P2、P2 、P1 执行 的 语句 。 
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(a) 有 多 少 种 可 能 的 、 不 同 的 执行 序列 ? 用 简写 法 列 出 每 种 可 能 的 序列 。 对 于 每 个 序列 ， 说 明 
numRes 是 否 有 正确 的 值 。 
(b) 所 有 可 能 的 序列 中 有 百 分 之 多 少 产生 不 正确 的 结果 ? 
(c) 这 个 比例 是 否 就 是 程序 运行 时 可 能 得 到 不 正确 结果 的 概率 ? 请 解释 。 
18. 下 面 这 段 代码 尝试 实现 临界 区 ， 类 似 于 图 8-26 中 的 程序 ， 除 了 入 口 段 中 语句 的 顺序 不 一 样 外 : 


进程 P1 进程 P2 
do do 
while (enter2) while (enter1) 
; //nothing ; //nothing 
enterl = TRUE enter2 = TRUE 
critical section critical section 


enterl = FALSE; 


remainder section 


enter2 = FALSE; 


remainder section 


while (!donel) ; while (!done2) ; 


* (a) 这 个 算法 能 保证 互 斥 吗 ? 如 果 不 能 ， 给 出 一 个 执行 序列 使 得 两 个 进程 能 同时 进入 它们 的 临界 区 。 
(b) 该 算法 能 预防 死 锁 吗 ? 如 果 不 能 ， 给 出 能 导致 P1 和 了 2 死 锁 的 执行 序列 。 
19. 根据 wait() 和 signal() 的 定义 ， 解 释 s 的 大 小 是 被 阻塞 进程 的 数量 。 
20. 如 果 I 表示 执行 init(s)，W 表示 wait(s)， 而 S 表示 signal(s)。 那 么 ，IWWS 表示 操作 系统 中 某 些 进 
程 的 调用 序列 为 init(s)、wait(s)、wait(s) 和 signal(s)。 对 于 下 面 每 个 调用 序列 ， 说 明 s 的 值 和 序列 
中 最 后 一 个 调用 执行 后 被 阻塞 的 进程 数量 : 


*(a) IW (b) IS (c) ISSSW 
(d) IWWWS (e) ISWWWW 
21. 假设 3 个 并 发 的 进程 执行 下 面 的 代码 : 
进程 P1 进程 P2 进程 P3 
do do do 
wait (mutEx) ; wait (mutEx) ; wait (mutEx) ; 


critical section critical section critical section 
signal (mutEx) ; signal (mutEx) ; signal (mutEx) ; 
remainder section remainder section remainder section 


while (!done1) ; while (!done2) ; while (!done3); 


解释 该 代码 如 何 保证 对 这 3 TP ALK Oy lal EB A o 
22. 假设 s 和 1t 是 两 个 信号 量 ， 用 init(s) 和 init(t) 初始 化 。 考 虑 下 面 两 段 并 发 进程 代码 : 


进程 P1 进程 P2 

wait (s); wait (t); 

wait (t); wait (s); 
critical section critical section 
signal (s); signal (t) ; 
signal (t); signal (s); 
remainder section remainder section 


*(a) 该 算法 保证 互 斥 吗 ? 如 果 不 能 ， 给 出 一 个 执行 序列 使 得 两 个 进程 能 同时 进入 它们 的 临界 区 。 
(b) 该 算法 能 预防 死 锁 吗 ? 如果 不 能 ， 给 出 能 导致 P1 和 P2 死 锁 的 执行 序列 。 
23. 考虑 下 面 两 段 并 发 进程 代码 : 


进程 P1 进程 P2 
Statement 1 Statement 4 
Statement 2 Statement 5 


Statement 3 Statement 6 
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修改 这 段 代 码 保证 语句 5 在 语句 2 之 前 执行 。 用 信号 量 实现 。 


24. 下 面 每 段 代 码 在 人 口 段 或 出 口 段 中 包含 一 个 漏洞 。 说 明 每 段 代 码 是 否 仍 能 保证 互 斥 。 如 果 不 能 ， 给 


出 会 违反 互 斥 的 执行 序列 。 说 明 是 否 会 出 现 死 锁 。 如 果 会 ， 给 出 相应 的 执行 序列 。 


*(a) 


进程 P1 

do 
wait (mutEx) ; 
critical section 
signal (mutEx) ; 
remainder section 

while (!donel) ; 


(b) 
进程 P1 

do 
signal (mutEx) ; 
critical section 
wait (mutEx) ; 
remainder section 

while (!donel) ; 


(c) 
进程 P1 

do 
wait (mutEx) ; 
critical section 
signal (mutEx) ; 
remainder section 

while (!donel) ; 


(d) 
进程 P1 

do 
wait (mutEx) ; 
critical section 
signal (mutEx) ; 
remainder section 

while (!donel) ; 


(e) 
进程 P1 

do 
wait (mutEx) ; 
critical section 
signal (mutEx) ; 
remainder section 

while (!done1l) ; 


8.4% 


进程 P2 
do 
signal (mutEx) ; 
critical section 
wait (mutEx) ; 
remainder section 
while (!done2) ; 


进程 P2 
do 
signal (mutEx) ; 
critical section 
wait (mutEx) ; 
remainder section 
while (!done2) ; 


进程 P2 
do 
wait (mutEx) ; 
critical section 
wait (mutEx) ; 
remainder section 
while (!done2) ; 


进程 P2 
do 
wait (mutEx) ; 
critical section 
remainder section 
while (!done2); 


进程 P2 
do 
critical section 
signal (mutEx) ; 
remainder section 
while (!done2) ; 


25. 一 个 操作 系统 中 有 进程 P1 、P2、P3 和 了 P4， 资 源 R1 (一 个 )、R2 (一 个 )、R3 (2%) 和 R4 (3%). 
(1, 1), (2, 2), (1, 2) 表示 P1 请 求 R1， 然 后 P2 请 求 R2， 然 后 P1 请 求 R2。 注 意 ， 前 两 个 请 
求 在 资源 分 配 图 上 生成 两 条 分 配 边 ， 但 是 第 三 个 请 求生 成 一 条 请 求 边 ， 因 为 R2 已 经 分 配给 了 P2。 
画 出 下 面 每 个 请 求 序 列 执行 后 的 资源 分 配 图 ， 说 明 每 个 资源 分 配 图 是 否 包含 循环 。 如 果 有 ， 说 明 是 
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否 是 死 锁 循环 。 


*(a) (1, 1), (2, 2), (1, 2), (2, 1) 
* (b) (1, 4), (2, 4), (3, 4), (4, 4) 


(ce) (1, 1), (2, 1), GB, 1), (4, 1) 

(d) (3, 3), (4, 3), (2, 2), (3, 2), (2, 3) 

(e) (1, 2), (1, 3), (1, 4), (2, 2), (2, 3), (2, 4) 

ME): (25, Wakil, 2,25 3),. (8s 39) 25.-2)5 1, 3) 

(ge) @; 1)... 2), @;,3),.8,,3) 2, 2); (1,3), G, 1) 

(h) (1, 4), (2, 3), (3, 3), (2, 1), (3, 4), (1, 3), (4, 4), (3, 1), (2, 4) 

(i) (1, 4), (2, 3), (3, 3), (2, 1), (3, 4), (1, 3), (4, 4), (3, 1), (2, 4), (4, 3) 


编程 题 
8.2 节 


26. 


Zi. 


28. 


29. 


30. 


3 


pas 


32: 


33. 


实现 一 条 新 的 一 元 指令 ， 替 代 NOP0， 称 为 ASL2， 它 把 累加 器 左 移 2 位 。NZC 位 应 该 与 第 二 次 位 
移 后 累加 器 中 的 值 保持 一 致 。 如 果 第 一 次 位 移 或 第 二 次 位 移 发 生 溢出 ， 则 V 置 位 。 使 用 Pep/9 应 
用 程序 提供 的 测试 程序 来 检测 新 指令 的 特性 。 

实现 一 条 新 的 非 一 元 指令 ， 代 蔡 NOP， 称 为 ASLMANY, 它 的 操作 数 是 累加 器 左 移 的 次 数 。 只 人 允 
许 直 接 寻 址 。NZC 位 应 该 与 最 后 一 次 位 移 后 累加 器 中 的 值 保持 一 致 。 只 要 任何 一 次 位 移 发 生 溢出 ， 
WW V 置 位 。 使 用 Pep/9 应 用 程序 提供 的 测试 程序 来 检测 新 指令 的 特性 。 

实现 一 条 新 的 非 一 元 指令 ， 替 代 NOP， 称 为 MULA， 它 把 累加 器 乘 以 操作 数 ， 结 果 放 人 累加 器 中 。 
只 允许 直接 寻 址 。 使 用 习题 6.24 的 递归 位 移 相 加 算法 。NZC 位 应 该 与 最 后 一 次 加 法 后 累加 器 中 的 
值 保持 一 致 。 只 要 任何 一 次 位 移 或 加 法 发 生 溢出 ， 则 V 置 位 。 使 用 Pep/9 应 用 程序 提供 的 测试 程 
序 来 检测 新 指令 的 特性 。 

直接 寻 址 就 是 立即 数 寻 址 再 间接 寻 址 ， 间 接 寻 址 就 是 直接 寻 址 再 间接 寻 址 。 把 这 个 概念 再 进 一 
步 推论 ， 两 次 间接 寻 址 ， 也 就 是 间接 寻 址 再 间接 寻 址 。 实 现 一 条 新 指令 ， 替 代 NOP0， 其 助 记 符 
为 STWADI， 代 表 Store Word Accumulator Double Indirect (存储 字 累 加 器 ， 两 次 间接 寻 址 )。 它 
使 用 两 次 间接 寻 址 来 存储 累加 器 。 不 影响 标志 位 。 对 于 汇编 器 和 CPU 来 说 ，NOP0 是 一 条 一 元 指 
令 ， 但 是 你 的 程序 必须 把 它 实 现 为 非 一 元 指令 。 需 要 对 保存 的 PC 加 1 以 跳 过 操作 数 指示 符 。 使 用 
Pep/9 应 用 程序 提供 的 测试 程序 来 检测 新 指令 的 特性 。 

实现 一 条 新 的 非 一 元 指令 ， 蔡 代 NOP， 称 为 BOOLO ， 意 思 是 输出 布尔 值 。 如 果 操 作 数 为 0， 输出 
false， 和 否则 输出 true。 人 允许 立即 数 、 直 接 和 栈 相对 寻 址 。 不 影响 标志 位 。 使 用 Pep/9 应 用 程序 提供 
的 测试 程序 来 检测 新 指令 的 特性 。 


. 实现 一 条 新 的 一 元 指令 ， 蔡 代 NOP0， 称 为 STKADD, 它 把 栈 项 最 高 两 项 替换 为 它们 的 和 。 根 据 


加 法 的 结果 设置 NZVC 标志 位 。 使 用 Pep/9 应 用 程序 提供 的 测试 程序 来 检测 新 指令 的 特性 。 

实现 一 条 新 的 非 一 元 指令 ,替代 NOP， 称 为 XORA， 它 把 操作 数 和 累加 器 进行 按 位 异 或 运算 ， 并 

将 计算 结果 存 人 累加 器 。 只 人 允许 直接 寻 址 。 根 据 运 算 的 结果 设置 NZ 标志 位 ，VC 标志 位 保持 不 变 。 

使 用 Pep/9 应 用 程序 提供 的 测试 程序 来 检测 新 指令 的 特性 。 

本 问题 实现 一 条 新 的 、 处 理 浮 点 数 的 、 非 一 元 指令 。 假 设 浮 点 数 与 [EEE754 的 所 有 特殊 值 设 定 方 

法 一 致 ， 但 采用 的 格式 是 一 个 数 占 用 2 字 节 ， 其 中 包括 了 1 位 符号 位 ，6 位 指数 位 ，9 位 有 效 位 和 

一 个 隐藏 位 。 指 数 采 用 余 31 码 表 示 ， 而 非 规格 化 数 采 用 余 30 码 。 

(a) 实现 一 条 新 的 一 元 指令 ,替代 DECO， 称 为 BINFO， 表 示 二 进 制 浮 点 输出 。 人 允许 和 DECO 同 
样 的 寻 址 方式 。 值 3540 (hex) 表示 规格 化 数 1.101 x 2“”， 应 该 输出 1.101000000b011010， 这 里 
字母 b 表示 是 2 的 徊 ,b 后 面 的 位 序列 是 -5 的 余 31 码 表示 。 值 0050 (hex)， 表 示 非 规格 化 数 
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0.001 01x2™, nei AW 0.001010000b-30, ZEX HIERHER, FERS -30 WE 
值 为 NaN， 那 么 就 输出 NaN ， 正 无 穷 大 输出 inf， 负 无 穷 大 输出 -inf。 

(b) 实现 一 条 新 的 一 元 指令 ， 替 代 DECI， 称 为 BINFI， 表 示 二 进 制 浮 点 输入 。 人 允许 和 DECI 同 
样 的 寻 址 方式 。 假 设 输入 总 是 规格 化 二 进 制 数 。 输 入 1.101000000b011010， 表 示 规 格 化 数 
1.101 x 2“， 应 该 存储 为 3540(hex)。 

(c) 实现 一 条 新 的 一 元 指令 ， 替 代 NOP， 称 为 ADDFA， 表 示 浮 点 累加 器 加 法 。 人 允许 与 ADDA 同样 
的 寻 址 方式 。 对 于 规格 化 和 非 规格 化 数 ， 都 假设 两 个 加 数 的 指数 字段 是 相同 的 ， 但 是 和 的 指数 
字段 不 一 定 要 和 初始 的 指数 字段 相同 。 你 的 实现 需要 在 执行 加 法 之 前 插入 隐藏 位 ， 存 储 结果 之 
前 去 除 隐 藏 位 。 考 虑 操作 数 中 的 一 个 或 者 两 个 可 能 为 NaN 或 者 无 穷 大 的 情况 。 

(d) 假设 规格 化 数 或 者 非 规格 化 数 的 指数 字段 可 能 不 相同 的 情况 ， 再 做 一 遍 (c) 部 分 的 问题 。 
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操作 系统 的 目的 是 为 高 级 编程 提供 更 加 方便 的 环境 ， 并 有 效 分 配 系统 资源 。 第 8 章 介 
绍 了 操作 系统 如 何 为 系统 中 的 进程 分 配 CPU 时 间 ， 而 本 章 将 介绍 它 是 如 何 分 配 存储 空间 的 。 
存储 空间 主要 分 为 两 类 : 主 存 和 外 围 存储 器 。 磁 盘存 储 器 是 最 常见 的 外 围 存储 器 ， 也 是 本 章 
将 要 描述 的 。 


9.1 内 存 分 配 


没有 在 执行 的 程序 通常 存在 磁盘 文件 中 。 要 执行 程序 就 需要 主 存 空间 和 CPU 时 间 。 操 
作 系 统 把 程序 从 磁盘 加 载 到 主 存 ， 为 程序 分 配 空间 ; 把 程序 计数 器 设置 为 加 载 到 内 存 里 的 第 
一 条 指令 的 地 址 ， 为 程序 分 配 时 间 。 

本 章 前 两 节 讲 述 分 配 主 存 空间 的 5 种 技术 : 

o 单 道 程序 设计 (uniprogramming) 

e 固定 分 区 多 道 程序 设计 (fixed-partition multiprogramming ) 

e 可 变 分 区 多 道 程序 设计 (variable-partition multiprogramming ) 

e 分 页 (paging) 

e 虚拟 内 存 (virtual memory) 

这 些 技术 按照 列 出 的 顺序 依次 变 得 复杂 ， 每 一 项 都 解决 了 一 个 性 能 问题 ， 是 对 上 一 项 技 
术 的 改进 。 本 书 没有 讨论 第 六 种 技术 一 一 分 段 。 


9.1.1 单 道 程序 设计 


最 简单 的 内 存 分 配 技术 是 单 道 程序 设计 ，Pep/9 操作 系统 就 是 这 样 的 例子 。 操 作 系 统 驻 
留 在 内 存 的 一 端 ， 应 用 程序 在 男 一 端 。 系 统一 次 只 执行 一 个 作业 。 

因为 每 个 作业 都 加 载 在 同一 个 位 置 ， 所 以 翻译 器 也 会 相应 地 生成 目标 代码 。 例 如 Pep/9 
汇编 器 假设 第 一 个 字 节 加 载 到 地 址 0000 (hex) ， 然 后 从 符号 表 计 算 符 号 地 址 。 或 者 ， 如 果 程 
序 包含 一 个 burn (HEA) 伪 指令 ， 则 汇编 器 假设 最 后 一 个 字 节 将 加 载 到 该 伪 指令 指定 的 地 址 。 

单 道 程序 设计 有 优点 也 有 缺点 。 主 要 优点 体现 在 大 小 方面 。 这 样 的 系统 可 以 很 小 ， 设 计 
简单 ， 因 此 不 容易 出 错 ， 执 行 起 来 几乎 没有 开销 。 应 用 程序 一 旦 加 载 进来 ， 就 会 100% 占用 
处 理 器 的 时 间 ， 因 为 没有 其 他 进程 会 中 断 它 。 单 道 程序 设计 系统 适用 于 髋 入 式 系统 ， 比 如 控 
制 微波 炉 的 系统 。 

单 道 程序 设计 的 主要 缺点 是 CPU 时 间 利 用 率 很 低 ， 而 且 作 业 调 度 很 不 灵活 。 相 比 起 主 
存 ， 磁 盘存 储 器 的 访问 时 间 较 长 。 如 果 应 用 程序 从 磁盘 读数 据 ，CPU 会 一 直 空 闪 ， 等 待 磁 
盘 输 入 。 这 段 时 间 如 果 能 用 来 执行 其 他 用 户 的 作业 就 会 更 好 。 对 于 一 台 微 型 计算 机 来 说 ， 可 
以 容忍 浪费 一 些 CPU 时 间 ， 但 是 对 于 花费 几 十 万 的 计算 机 来 说 就 不 能 忍受 了 ， 特 别 是 在 多 
用 户 系统 中 ， 进 程 是 并 发 执行 的 ， 那 就 更 不 能 忍受 了 。 
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甚至 在 单一 用 户 系统 中 ， 作 业 调 度 不 灵活 也 是 很 讨厌 的 。 用 户 可 能 想 要 启动 两 个 程序 ， 
并 在 两 者 之 间 来 回 切换 而 不 退出 任何 一 个 。 例 如 ， 你 可 能 想 要 运行 一 会 儿 字 处 理 程 序 ， 然 后 
再 切换 到 画图 程序 画 文档 的 插图 ， 然 后 再 切换 回 字 处 理 程 序 继续 刚才 的 文字 编辑 。 


9.1.2 固定 分 区 多 道 程序 设计 


多 道 程序 设计 允许 并 发 运行 多 个 应 用 ,解决 了 CPU 利用 率 不 足 的 问题 。 要 在 两 个 进程 
间 进 行 切换 ， 操 作 系统 就 要 把 两 个 程序 都 加 载 进 主 
存 。 当 运行 进程 被 暂停 时 ， 操 作 系统 会 把 它 的 进程 


控制 块 存储 起 来 ， 然 后 再 把 CPU 交 给 另 一 个 程序 。 0 

要 实现 多 道 程序 设计 ， 操 作 系统 需要 把 主 存 划 fa 
分 成 不 同 的 分 区 ， 分 别 存储 不 同 的 正在 执行 的 进 |e) 
程 。 在 固定 分 区 方案 中 ,操作 系统 把 内 存 分 成 几 个 m 


大 小 和 位 置 不 会 随时 间 改 变 的 分 区 。 图 9-1 给 出 了 
一 种 可 能 的 划分 ， 这 是 一 个 主 存 大 小 为 64 KiB 的 
固定 分 区 多 道 程序 设计 系统 。 操 作 系 统 占 用 内 存 
底部 的 16KiB。 它 假设 作业 的 大 小 并 不 都 一 样 ， 所 一 
以 把 剩余 的 48 KiB 划分 为 2 个 4KiB 的 分 区 、1 个 
8KiB 的 分 区 和 1 个 32KiB 的 分 区 。 

为 不 同 进程 提供 不 同 的 内 存 分 区 会 带 来 一 个 问 
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题 ， 那 就 是 目标 代码 中 的 内 存 引用 必须 进行 相应 的 Os 

调整 。 假 设 汇 编 语 言 程 序 员 写 了 一 个 应 用 程序 ， 大 

小 为 20KiB， 操 作 系统 把 它 装 载 进 一 个 32KiB 的 分 i 

区 。 如 果 汇 编 器 假设 目标 代码 会 被 加 载 进 从 地 址 0 ot 

开始 的 内 存 ， 那 么 所 有 内 存 引 用 就 都 错 了 。 图 9-1 64KiB 主 存 的 固定 分 区 。 分 区 的 
例如 ,假设 代码 开始 的 几 行 是 大 小 和 地 址 以 千 字 节 (KiB) 为 单 
0000 040005 BR AbsVal 位 ， 操 作 系 统 占 用 底部 的 16KiB 


0003 0000 number: .BLOCK 2 

0005 310003 AbsVal: DECI number,d 

汇编 器 把 符号 AbsVal 的 值 计算 为 0005， 因 为 BR 是 一 条 3 字 节 指令 ，number 占用 2 个 
字 节 。 现 在 的 问题 是 BR 分 支 跳 转 到 0005， 这 是 第 一 个 分 区 中 进程 的 代码 地 址 。 不 仅 这 个 
进程 会 运行 错误 ， 还 有 可 能 破坏 其 他 进程 的 数据 。 操 作 系 统 需要 保护 进程 不 受 其 他 并 发 进程 
的 未 授权 算 改 。 

能 够 把 程序 加 载 到 内 存 中 任意 位 置 的 装载 器 称 为 可 重 定 位 装载 器 。8.1 节 中 讲述 的 Pep/9 
装载 器 不 是 可 重 定位 的 装载 器 ， 因 为 它 把 每 个 程序 都 加 载 到 内 存 的 同一 位 置 ， 也 就 是 0000 
(hex). 

解决 这 个 问题 有 几 种 方法 。 操 作 系 统 可 以 要 求 汇编 语言 程序 员 决定 把 程序 加 载 到 内 存 的 
什么 位 置 。 汇 编 器 需要 提供 一 个 伪 指令 以 允许 程序 员 指 定 目标 代码 的 第 一 个 字 节 的 地 址 。 这 
样 的 伪 指 令 常见 的 名 字 是 .ORG， 意 思 是 origin (起 点 )。 在 这 个 例子 中 ，32KiB 分 区 的 起 始 
地 址 是 16Ki 或 者 说 8000 (hex)。 代 码 的 前 几 行 改 成 如 下 形式 : 


.ORG 0x8000 
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8000 048005 BR Absval 
8003 0000 number: .BLOCK 2 
8005 318003 AbsVal: DECI number,d 
其 效果 就 是 把 应 用 程序 代码 中 的 所 有 内 存 引 用 都 加 上 8000。 
如 果 编 译 器 为 应 用 程序 生成 目标 代码 ， 那 么 程序 员 是 没有 内 存 地 址 概念 的 。 翻 译 器 需要 
和 操作 系统 合作 生成 正确 的 目标 代码 中 的 内 存 引用 。 


9.1.3 ”逻辑 地 址 


要 求 程 序 员 或 编译 器 事先 指定 将 目标 代码 装载 到 哪里 有 几 个 缺点 。 应 用 程序 的 程序 员 不 
应 该 担心 分 区 的 大 小 和 位 置 ， 这 样 的 信息 与 程序 员 应 该 没有 关系 。 这 种 方案 背离 了 操作 系统 
要 为 高 级 编程 提供 方便 环境 的 目标 。 

它 还 背离 了 高 效 分 配 系统 资源 的 目标 。 假 设 程序 员 指 定 把 一 个 3KiB 的 程序 加 载 到 第 二 
个 4KiB 的 分 区 ， 它 从 地 址 4Ki 开始， 并 且 相 应 地 设置 .ORG 伪 指 令 。 在 系统 运行 过 程 中 ， 
即使 第 一 个 4KiB 分 区 是 空闲 的 ， 该 作业 还 是 有 可 能 等 待 另 一 个 占用 第 二 个 4KiB 分 区 的 作 
业 才 能 加 载 。 有 未 使 用 的 内 存 就 表示 资源 分 配 不 够 高 效 。 

要 解决 这 些 问 题 ， 操 作 系 统 需 支 持 程序 员 或 编译 器 生成 “好 像 ”会 被 加 载 到 地 址 0 的 目 
标 代 码 。 在 这 种 假设 下 生成 的 地 址 称 为 逻辑 地 址 (logical address)。 如 果 程 序 被 加 载 到 地 址 
不 是 0 的 分 区 中 ， 那 么 操作 系统 必须 把 逻辑 地 址 翻译 成 物理 地 址 (physical address ) 。 

下 面 公式 描述 的 是 物理 地 址 、 催 辑 地 址 和 程序 加 载 到 的 分 区 第 一 个 字 节 的 地 址 之 间 的 
关系 : 

物理 地 址 = 逻辑 地 址 + 分 区 地 址 

在 前 面 代码 片段 的 例子 中 ，number 的 逻辑 地 址 是 0003 ， 而 物理 地 址 是 8003 。 

有 两 种 可 行 的 地 址 翻译 技术 。 操 作 系 统 可 以 提供 一 个 软件 工具 ， 把 分 区 地 址 加 到 目标 代 
码 中 的 所 有 内 存 引 用 上 。 翻 译 器 需要 指定 对 目标 代码 中 哪些 部 分 进行 调整 ， 因 为 只 通过 检查 
原始 目标 代码 ， 工 具 不 能 分 辩 哪 些 部 分 是 内 存 引 用 。 

另 一 种 技术 依赖 于 特殊 的 硬件 ， 称 为 基 址 和 边界 寄存 器 。 基 址 寄存 器 (base register) 解 
决 了 地 址 翻译 的 问题 ， 边 界 寄存 器 (bound register) 解决 的 是 保护 的 问题 。 图 9-2 展示 了 对 
前 面 的 例子 来 说 ， 基 址 和 边界 寄存 器 是 怎么 工作 的 。 





基 址 寄存 器 边界 寄存 器 
sm 
0003 8003 
CPU 
逻辑 地 址 物理 地 址 false 合法 物理 地 址 
非法 地 址 中 断 


图 9-2 ”用 基 址 和 边界 寄存 器 把 逻辑 地 址 翻译 成 物理 地 址 


操作 系统 把 使 用 未 修改 逻辑 地 址 的 目标 程序 加 载 到 在 地 址 8000 的 分 区 中 ， 然 后 把 基 址 
寄存 器 加 载 为 值 8000， 边 界 寄存 器 加 载 为 值 A000 (hex) = 48 Ki， 这 是 该 程序 加 载 到 的 分 区 
的 上 界 。 操 作 系 统 把 程序 计数 器 设置 为 0000， 即 第 一 条 指令 的 逻辑 地 址 ， 也 就 把 CPU 交 给 
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了 该 进程 。 

每 当 CPU 发 出 一 条 内 存 读 请 求 ， 硬 件 就 把 基 址 寄存 器 的 内 容 加 到 CPU 提供 的 地 址 上 ， 
形成 物理 地 址 。CPU 会 把 物理 地 址 与 边界 寄存 器 的 内 容 进 行 比较 ， 如 果 物 理 地 址 小 于 边界 
寄存 器 ， 那 么 硬件 会 完成 该 内 存 访 问 ; 否则 会 生成 非法 地 址 中 断 ， 操 作 系 统 必 须 服务 该 中 
断 。 边 界 寄存 器 阻止 进程 侵入 其 他 进程 的 内 存 分 区 。 

这 个 例子 中 第 一 个 内 存 读 请 求 将 来 自 于 冯 … 诺 依 曼 执行 周期 中 的 取 指 部 分 。CPU 会 请 
SRM 0000 获取 一 条 指令 ， 硬 件 会 翻译 成 从 8000 取 指 。 图 9-2 给 出 的 是 对 DECI 操作 数 指示 
符 的 逻辑 地 址 0003 的 翻译 。( 实 际 上 ， 在 较 低 的 抽象 层次 上 ， 它 是 DECI 陷阱 处 理 程序 中 在 
FEB7 处 的 STWA 指令 的 操作 数 。) 

为 了 切换 到 另 一 个 进程 ， 操 作 系统 把 基 址 寄存 器 设置 为 该 进程 加 载 到 的 分 区 的 地 址 ， 把 
边界 寄存 器 设置 为 第 二 个 分 区 的 地 址 。 当 操作 系统 从 PCB 恢复 出 CPU 寄存 器 (包括 程序 计 
Bae) 时 ， 进 程 会 从 它 被 挂 起 的 地 方 继续 执行 。 

考虑 当 操 作 系 统 必 须 调 度 作 业 来 占用 固定 分 区 时 所 面临 的 问题 。 假 设 图 9-1 中 所 有 分 区 
都 被 占用 了 ， 除 了 32KiB 的 分 区 。 如 果 有 一 个 4KiB 的 作业 请 求 执行 ， 系 统 应 该 把 它 放 人 这 
个 32KiB 的 分 区 中 ,还 是 应 该 继续 等 待 更 小 的 可 用 分 区 ? 假设 把 作业 放 进 32KiB 的 分 区 中 ， 
然后 有 一 个 4KiB 的 进程 终止 。 如 果 此 时 有 一 个 32KiB 的 作业 进入 系统 ， 系 统 就 不 能 加 载 它 
了 。 反之， 如 果 不 把 小 作业 调度 到 大 分 区 中 会 更 好 一 些 ， 因 为 这 样 大 作业 就 能 在 它 一 请 求 执 
行 时 就 使 用 大 分 区 了 ， 而 小 作业 也 能 很 快 被 加 载 进 来 。 操 作 系 统 不 能 预测 进程 什么 时 候 结 束 
或 者 什么 时 候 请 求 执行 ， 所 以 没有 办 法 实现 最 优 调 度 。 

另 一 个 问题 是 操作 系统 一 开始 该 如 何 设立 这 些 分 区 呢 ? 在 图 9-1 中 ， 如 果 有 一 个 16KiB 
的 作业 和 一 个 32KiB 的 作业 同时 请 求 执行 ， 那么 系统 只 能 加 载 一 个 ， 即 使 实际 上 用 户 内 存 
可 用 空间 总 量 是 48KiB。 男 一 方面 ， 如 果 操 作 系 统 把 用 户 内 存 划 分 为 两 个 大 的 分 区 ,而 有 6 
个 或 8 个 4KiB 的 作业 请 求 执行 ,那么 除了 两 个 作业 外 其 他 的 都 会 被 延迟 。 还 是 没有 办 法 实 
现 最 优 分 区 ， 因 为 操作 系统 不 能 预测 未 来 。 


9.1.4 可 变 分 区 多 道 程 序 设计 


为 了 解决 固定 分 区 调度 中 固有 的 低 效 率 ， 操 作 系 统 可 以 维护 边界 可 变 的 分 区 ， 方 法 是 只 
在 作业 加 载 进 内 存 时 才 设立 分 区 。 分 区 的 大 小 可 以 正好 适合 作业 的 大 小 ， 这 样 作 业 在 进入 系 
统 时 就 会 有 更 多 内 存 可 用 。 

当 作业 停止 执行 时 ， 它 占用 的 内 存 区 域 就 可 以 供 其 他 作业 使 用 了 。 可 供 新 到 来 的 作业 使 
用 的 内 存 区 域 称 为 洞 (hole)。 当 操作 系统 把 洞 分 配给 后 来 的 作业 时 ， 称 为 把 洞 填 上 了 。 与 固 
定 分 区 方案 一 样 ， 操 作 系 统 调度 作业 使 得 任意 时 刻 内 存 中 的 进程 数 最 大 。 

图 9-3 给 出 了 一 个 可 用 内 存 区 域 为 48KiB 的 例子 ， 此 时 尚未 调度 任何 作业 。 图 9-4 是 一 
个 假想 的 、 对 图 9-3 所 示 用 户 内 存 进行 请 求 的 作业 序列 。 当 作业 停止 执行 时 ,会 释放 它 的 内 
存 供 其 他 作业 使 用 。 

图 9-5 说 明了 调度 过 程 。 现 在 问题 是 必须 解决 选择 标准 的 问题 ， 也 就 是 当 新 作业 请 求 内 
存 时 先 填 哪 个 洞 。 图 9-5 使 用 的 方法 称 为 最 优 适 配 算法 ( best-fit algorithm)。 在 所 有 大 于 作 
业 要 求 内 存量 的 洞 中 ， 操 作 系统 选择 最 小 的 那个 。 也 就 是 说 ， 系 统 选择 最 适合 该 作业 的 洞 。 

当 J1 请 求 12 KiB 时 ， 对 于 图 9-3 中 的 初始 洞 ， 只 有 一 个 洞 能 够 用 来 分 配 内 存 。 系 统 把 
最 开始 的 12KiB 分 给 刀 ， 剩 下 一 个 36KiB 的 洞 。 当 也 请求 8KiB 时 ， 系 统 把 洞 的 前 面 一 部 
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分 分 配给 它 ， 对 于 J3、J4 AIS 来 说 过 程 类 似 ,得 到 图 9-5a 所 示 的 内 存 分 配 结果 。 
































0 

4 

8 

12 

16 

20 

24 

28 i 

z i 

36 . 

40 4 

44 8 

4g + Nog Stat 

9-3 初始 可 用 的 用 户 内 存 。 地 址 以 9-4 可 变 分 区 多 道 程序 设计 系统 的 
千 字 节 (KiB) 为 单位 一 个 作业 执行 序列 。 作 业 大 小 以 
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a) 启动 到 ]5 b) J1 停止 c) 启动 J6 d) J5 停止 e) JAZ) J7 
图 9-5 最 优 适 配 算法 


图 9-5b 展示 了 当 J1 停止 执行 时 的 分 配 状况 ， 此 时 会 清除 Jl 的 12KiB， 在 主 存 顶 部 生 
成 了 一 个 新 的 洞 。 当 J6 请 求 一 个 4KiB 的 区 域 时 ， 操 作 系 统 可 以 选择 将 两 个 洞 中 的 任意 一 个 
分 配给 它 。 根 据 最 优 适 配 算法 ， 系 统 选择 8KiB 而 不 是 12KiB 的 洞 ， 因 为 较 小 的 洞 适 配 得 更 
好 。 图 9-5c 给 出 了 结果 。 

图 9-5d 是 JS 停止 之 后 的 分 配 情 况 ， 图 9-5e 是 系统 从 顶部 的 洞 给 J7 分 配 内 存 之 后 的 情 
况 。 现 在 有 三 个 小 的 洞 分 散在 整个 内 存 中 ， 这 种 现象 称 为 碎片 〈fragmentation)。 即 使 J8 想 
要 8KiB ， 可 用 内 存 的 总 量 是 12KiB J8 也 不 能 运行 ， 因 为 可 用 内 存 不 是 连续 的 。 

当 出 现 由 于 碎片 内 存 而 不 能 满足 请 求 时 ， 操 作 系 统 只 能 等 待 足够 多 的 进程 完成 ， 才 能 有 
一 块 足够 大 的 内 存 可 用 。 在 这 个 例子 中 ， 该 请 求 很 小 ， 任 意 一 个 作业 完成 都 能 释放 足够 多 的 
内 存 让 J8 得 以 加 载 。 
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在 很 拥挤 的 系统 中 运行 着 许多 小 作业 ， 如 果 有 一 个 大 作业 在 等 待 ， 那么 该 请 求 可 能 要 等 
待 很 长 时 间 才 能 得 到 分 配 。 这 种 情况 下 ， 操 作 
系统 可 能 需要 花 点 儿 时 间 移 动 一 些 进 程 ， 以 得 
到 一 个 足够 大 的 洞 来 满足 该 请 求 。 这 个 操作 称 
为 压缩 (compaction ) 。 

图 9-6a 是 一 种 很 直观 的 合并 技术 。 操 作 
系统 把 进程 都 移动 到 内 存 上 部 ， 消 除 它 们 之 间 
的 所 有 洞 。 另 一 种 可 行 的 合并 方案 是 只 移动 必 
要 的 进程 ， 从 而 得 到 一 个 满足 请 求 的 、 足 够 大 
的 洞 。 在 图 9-6b 中 系统 只 移动 J6， 就 可 以 得 
到 一 个 足够 加 载 J8 的 洞 了 。 

最 优 适 配 算法 的 思路 是 使 用 尽 可 能 小 的 
洞 ， 把 大 的 洞 留 给 未 来 的 调度 ， 通 过 这 种 方 
式 实现 碎片 最 小 化 。 另 一 种 调度 技术 看 上 去 a) 把 全 部 作业 移动 到 顶部 b) 只 移动 J6 
可 能 不 那么 合理 ， 叫 作 最 先 适 配 算法 〈first-fit 图 9-6 合并 主 存 
algorithm )。 该 算法 不 是 寻找 最 小 的 可 能 的 洞 ， 

而 是 从 主 存 顶 部 开始 搜索 ， 从 能 够 容纳 该 请 求 的 第 一 个 洞开 始 分 配 内 存 。 图 9-7 就 是 最 先 适 
配 算法 对 图 9-4 中 请 求 序 列 的 跟踪 记录 。 






































a) Free J1 F1 Js b) J1 停止 c) 开始 J6 d) J5 停止 e) 开始 J7 
图 9-7 最 先 适 配 算法 


图 9-7a 和 图 9-7b 与 图 9-5 中 的 最 优 适 配 算法 一 样 。 在 图 9-7c 中 ，J6 请 求 一 个 4KiB 的 
分 区 ， 最 先 适 配 算法 不 会 从 内 存 底部 最 小 的 洞 来 分 配 ， 而 是 发 现 内 存 项 部 的 洞 ， 并 从 它 分 配 
空间 给 J6。 

图 9-7d4 中 J 终 止 ， 图 9-7e 中 ， 位 于 J6 和 了 J 之 间 的 第 一 个 可 用 的 洞 就 能 满足 J7 的 
8KiB 请 求 。 当 J8 请 求 8KiB 时 ， 有 一 个 洞 可 用 ， 系 统 不 需要 合并 内 存 。 

一 个 例子 并 不 能 说 明 最 先 适 配 比 最 优 适 配 好 。 实 际 上 ， 你 可 以 设计 一 个 请 求 和 释放 序 
列 ， 使 得 使 用 最 先 适 配 比 最 优 适 配 先 需要 合并 。 那 么 问题 就 是 “平均 起 来 效果 是 什么 样 的 
呢 ?” 实 际 结果 是 在 内 存 利 用 率 上 ， 两 种 算法 中 没有 一 种 明显 优 于 另 一 种 。 
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最 先 适 配 算法 效果 不 错 的 原因 在 于 存储 系统 总 是 从 内 存 顶 部 进行 分 配 ， 就 容易 在 主 存 底 
部 形成 较 大 的 洞 ， 如 图 9-7 所 示 。 

无 论 分 配 策略 如 何 ， 在 可 变 分 区 系统 中 ， 碎 片 是 不 可 避免 的 。 非 连续 的 洞 就 意味 着 资源 
分 配 不 够 高 效 ， 虽 然 可 以 通过 合并 收回 那些 不 可 用 的 内 存 区 域 ， 但 这 仍然 是 一 个 很 耗 时 的 
过 程 。 


9.1.5 分 页 


分 页 是 一 种 解决 碎片 问题 的 创造 性 方法 ， 它 不 是 把 几 个 小 的 洞 合 并 成 一 个 大 的 洞 供 程序 
使 用 ， 而 是 把 程序 分 解 开 去 适合 洞 。 程 序 不 再 是 连续 的 ， 而 是 分 开 分 散在 整个 主 存 中 。 

图 9-8 展示 的 是 一 个 分 页 系统 中 正在 执行 的 三 个 作业 。 将 每 个 作业 划分 成 页 ， 将 主 存 划 
分 成 帧 (frame)， 帧 的 大 小 和 页 相同 。 该 图 给 出 了 一 个 64KiB 内 存 的 前 12KiB 空间 ， 帧 的 大 
小 为 1KiB。 页 的 大 小 总 是 2 的 过 ， 实 际 中 通常 4KiB。 

帧 地 址 Wis 


(hex) (dec) 
0000 0 






J3 
ase | > 








[ Page? P 
1800 





作业 分 割 为 1KiB 大 小 的 页 


owen nu fF WN 


Be 
83 
二 三 


内 存 分 割 为 1KiB 大 小 的 帧 
图 9-8 ”分 页 系统 


作业 J3 的 代码 分 布 在 主 存 四 个 非 连 续 的 帧 中 。 位 于 1800 的 帧 中 的 “J3，P0” 表 示人 作业 
J3 的 页 0， 第 二 页 在 2C00， 第 三 页 和 第 四 页 分 别 在 0800 和 2000. E, PEK J1 F J2 以 类 
似 方式 分 布 在 内 存 中 。 如 果 作 业 J4 到 达 ， 需 要 3 KB 内 存 ， 则 操作 系统 可 以 把 它 分 布 到 页 
0400、1000 和 1400。 系 统 不 需要 为 新 到 来 的 作业 而 合并 内 存 。 

和 前 面 多 道 程序 设计 内 存 管 理 技术 一 样 ， 使 用 分 页 技术 的 应 用 程序 会 假设 使 用 逻辑 地 
址 。 操 作 系 统 必须 在 执行 时 把 逻辑 地 址 转换 成 物理 地 址 。 

图 9-9 展示 的 是 图 9-8 所 示 分 页 系统 中 逻辑 地 址 和 物理 地 址 的 关系 。 因 为 页 的 大 小 是 
IKiB， 也 就 是 2"， 所 以 逻辑 地 址 最 右边 的 10 位 是 距离 页 顶部 的 偏 移 量 ， 最 左边 6 位 是 
页 号 。 

例如 地 址 058F ， 二 进 制 表示 是 0000 0101 1000 1111。 最 左边 6 位 是 0000 01， 表 示 该 地 
址 对 应 的 内 存 位 置 在 页 号 1 内 ; 因为 01 1000 1111 是 399 (dec)， 所 以 该 逻辑 地 址 表示 距离 
页 号 1 内 第 一 个 字 节 399 个 字 节 的 位 置 。 

参考 图 9-8， 这 个 字 节 的 物理 地 址 是 距离 地 址 为 2C00 的 帧 中 第 一 个 字 节 399 字 节 的 位 置 。 
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要 把 逻辑 地 址 翻译 为 物理 地 址 ， 操 作 系统 必须 把 6 位 页 号 0000 01 替换 成 6 位 帧 号 0010 11, 
偏 移 量 保留 不 变 。 


页 号 偏 移 量 帧 号 偏 移 量 
ee, Ga ES | SSeS 
_ a 
|<-6 bits>|<—10 bits >| |<-6 bits->|<— 10 bits —>| 

a) 逻辑 地 址 b) 物理 地 址 


图 9-9 分 页 系统 中 的 逻辑 地 址 和 物理 地 址 


在 前 面 的 内 存 管 理 方案 中 ， 一 个 基 址 寄存 器 足以 把 逻辑 地 址 翻译 成 物理 地 址 。 而 分 页 
需要 一 组 帧 号 ， 作 业 的 每 一 页 都 对 应 一 个 帧 号 。 这 样 的 帧 号 集合 称 为 页 表 (page table). 
图 9-10 给 出 的 是 图 9-8 中 作业 J3 关联 的 页 表 。 页 表 中 的 每 个 表 项 都 是 用 以 替换 逻辑 地 址 中 
页 号 的 帧 号 。 


= 
af 


帧 地 址 


~ 
Q 
a 
a 
~~ 






逻辑 地 址 
058F 


CPU 一 一 ”| 000001 ı 01 10001111 


二 Sem 二 -DO 


图 9-10 将 带 页 表 的 逻辑 地 址 翻译 成 物理 地 址 
假设 作业 J3 执行 如 下 语句 
LDBA 0x058F,d 


它 会 使 CPU 请 求 从 逻辑 地 址 058F 读 内 存 。 操 作 系 统 抽出 前 6 位 0000 01， 然 后 把 它们 作为 
页 表 地 址 ， 一 个 特殊 的 硬件 内 存 存储 着 该 作业 的 帧 号 。 从 页 表 中 读 出 的 帧 号 替换 逻辑 地 址 中 
的 页 号 ， 得 到 物理 地 址 。 
CPU 发 出 的 指令 是 读 取 地 址 058F 的 内 容 ， 但 实际 上 是 从 物理 地 址 P0 
2D8F 读 出 了 一 个 字 节 。 程 序 以 为 它 自己 被 加 载 到 一 片 从 地 址 0000 开始 
的 、 连 续 的 内 存 区 域 ， 操 作 系 统 通过 为 每 个 被 加 载 进 内 存 的 作业 提供 。 ?! 
一 个 页 表 来 维护 这 种 假象 。 这 完 完全 全 是 个 “骗局 ”， 实 际 上 进程 在 时 
间 上 不 断 中 断 ， 在 空间 上 也 是 分 散 的 ， 根 本 不 知道 自己 被 “欺骗 ”了 。 
分 页 也 没有 消除 碎片 ， 意 识 到 这 一 点 非常 重要 。 作 业 的 大 小 很 少 。 P3 
能 刚好 是 页 大 小 的 整数 倍 ， 这 样 一 来 最 后 一 页 中 就 会 有 一 些 内 存 未 Were SA). 
被 使 用 ， 图 9-11 展示 的 是 作业 J3 的 情况 。 作 业 最 后 一 页 中 未 被 使 用 图 9-11 内 部 碎片 
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的 内 存 称 为 内 部 碎片 〈internal fragmentation)， 区 别 于 可 变 分 区 策略 中 操作 系统 可 见 的 外 部 
碎片 。 

页 的 大 小 越 小 ， 平 均 来 说 内 部 碎片 就 越 少 。 不幸 的 是 ， 这 也 是 需要 权衡 折 中 的 。 页 的 大 
小 越 小 ， 对 给 定 大 小 的 主 存 ， 帧 数 就 越 多 ， 因 此 页 表 就 越 长 。 因 为 每 次 内 存 引 用 都 要 访问 页 
表 ， 页 表 通 常设 计 成 尽 可 能 快 的 电路 ， 这 是 很 昂贵 的 ， 所 以 页 表 必 须 保持 较 小 以 降低 成 本 。 


9.2 虚拟 内 存 


看 上 去 好 像 已 经 很 难 再 改进 分 页 系统 的 内 存 利用 率 了 , 但 是 实际 上 人 们 又 把 分 页 的 概念 
进一步 提升 了 。 考 虑 一 个 大 型 程序 的 结构 ， 比 如 说 可 能 会 装 满 50 页 。 要 执行 这 个 程序 ， 真 
的 有 必要 把 50 页 同时 全 部 装 进 主 存 四 ? 


9.2.1 大 程序 的 行为 


大 多 数 大 程序 都 是 由 几 十 个 过 程 组 成 的 ， 其 中 有 些 可 能 根本 不 会 执行 。 例 如 负责 处 理 输 
入 错误 情况 的 过 程 ， 如 果 输 入 没有 错误 ， 它 就 不 会 被 执行 。 再 如 初始 化 数据 等 其 他 过 程 ， 可 
能 只 执行 一 次 ， 在 剩 下 的 时 间 里 都 不 再 需要 执行 。 

大 程序 中 常见 的 控制 结构 是 循环 。 当 循环 体 反 复 执行 时 ， 只 有 循环 内 的 代码 需要 驻 留 在 
内 存 中 ， 循 环 外 部 〈 从 执行 的 角度 看 ) 距离 很 远 的 代码 不 需要 放 在 内 存 中 。 

程序 可 能 还 包括 很 大 的 从 未 访问 的 数据 区 域 。 例 如 ， 如 果 在 C 中 声明 了 一 个 结构 数组 ， 
但 是 不 知道 程序 运行 时 会 遇 到 多 少 个 这 样 的 结构 ， 可 能 就 会 分 配 比 预计 多 一 些 的 个 数 。 包 含 
这 些 不 会 被 访问 的 结构 的 页 就 不 需要 加 载 。 

对 典型 大 程序 的 分 析 表 明 ， 只 把 程序 中 活跃 的 页 加 载 进 内 存 是 可 行 的 。 活 路 的 页 包含 反 
复 执行 的 代码 和 反复 访问 的 数据 。 

活跃 页 的 集合 称 为 工作 集 (working set)。 随 着 程序 的 进展 ， 工 作 集中 会 加 入 新 的 页 ， 
也 会 有 旧 的 页 退出 。 例 如 ， 在 执行 开始 的 时 候 ， 包 含 初始 化 过 程 的 页 就 在 工作 集中 ， 随 后 工 
作 集 会 包括 处 理 过 程 的 页 ， 而 不 含有 初始 化 过 程 的 页 。 


9.2.2 虚拟 内 存 


记 住 ， 在 较 高 抽象 层次 上 的 程序 员 以 为 程序 是 在 逻辑 地 址 从 0 开始 且 连 续 的 内 存 中 执行 
的 。 假 设 系统 每 次 只 从 正在 执行 的 作业 加 载 几 个 页 ， 但 同时 仍然 保持 这 个 假象 ， 程 序 员 就 可 
能 编写 根本 不 能 一 次 性 装 入 主 存 的 超大 程序 ， 但 是 这 样 的 程序 仍然 能 够 执行 。 用 户 看 到 的 不 
是 已 经 安装 好 的 有 限 的 内 存 ， 而 是 一 个 虚拟 内 存 ， 只 受到 虚拟 地 址 和 磁盘 容量 的 限制 。 

例如 ， 在 较 老 的 Pep /7 计算 机 中 ， 地 址 是 16 位 的 ， 因 此 理论 上 可 以 访问 2“ 字 节 
(64KiB) 的 内 存 。 不 过 实际 上 只 安装 了 32KiB 内 存 。 应 用 程序 从 0000 开始 ， 不 能 装 超过 31 
000 (dec) 字 节 ， 和 否则 就 落 入 操作 系统 的 内 存 区 域 了 。 系 统 安装 少 于 地 址 位 数 允 许 的 内 存 是 
很 常见 的 ， 之 后 用 户 可 以 购买 更 多 的 内 存 来 升级 系统 。 

假设 Pep /7 计算 机 安装 了 一 个 支持 虚拟 内 存 的 操作 系统 。 程 序 的 物理 内 存 被 限制 为 
3000 字 节 ， 但 是 程序 员 还 是 想 执 行 64KiB 的 程序 。 操 作 系 统 把 执行 程序 所 需 的 页 面 从 磁盘 
加 载 到 内 存 帧 。 当 一 个 页 含有 要 执行 的 语句 或 要 访问 的 数据 时 ， 就 需要 加 载 它 ， 操 作 系 统 会 
去 除 一 个 不 再 活路 的 页 ， 蔡 换 为 需要 加 载 的 页 。 程 序 员 看 到 程序 在 一 个 64KiB 的 虚拟 地 址 
空间 中 执行 ， 实 际 上 物理 地 址 空间 只 有 32KiB。 
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图 9-12 展示 了 如 何 扩展 分 页 系统 以 实现 虚拟 内 存 系统 。 系 统 中 有 3 个 作业 , J 有 10 
Rh, DR 有 2 页 , B 有 4 页 。 注 意 ， 物 理 内 存 只 包含 8 帧 ， 但 是 即使 世 大 于 物理 内 存 ， 它 仍 
然 可 以 执行 。 操 作 系 统 需要 一 个 特殊 的 硬件 ， 为 每 个 作业 保存 一 张 页 表 ， 还 有 一 张 帧 表 ， 每 
个 表 项 对 应 一 个 帧 。 为 了 说 明 简 单 ， 帧 号 用 十 进 制 给 出 。 


页 表 主 存 帧 表 


qpa fg 
Jı J2 








帧 号 ”已 加 载 I E 作业 EY 





图 9-12 虚拟 内 存 的 一 种 实现 


页 表 把 逻辑 地 址 翻译 成 物理 地 址 ， 如 图 9-10 所 示 。 不 过 在 虚拟 内 存 系 统 中 ， 虽 然 作 业 
在 运行 ， 但 是 它 的 有 些 页 并 没有 加 载 到 内 存 中 。 页 表 中 每 个 页 都 有 额外 的 一 位 告诉 操作 系统 
该 页 是 否 已 加 载 。 如 果 页 已 经 加 载 到 内 存 中 了 ， 则 该 位 为 1， 否 则 为 0。 图 9-12 AY 表示 
1， 是 yes 的 意思 , 用 N 表示 0， 即 no。 

帧 表 是 为 了 帮助 操作 系统 为 各 个 作业 从 主 存 中 分 配 帧 。 第 一 项 表示 分 配给 该 帧 的 作业 ， 
第 二 项 这 1 位 称 为 脏 位 (dirty bit)， 它 的 功能 稍 后 解释 。 


9.2.3 KBAR 


图 9-12 说 明 作 业 刀 和 J3 并 没有 把 所 有 页 都 加 载 进 主 存 。 假 设 3 在 执行 页 Pl 中 的 代 
码 ，P1 被 加 载 进 帧 0， 接 下 来 就 要 执行 一 条 LDWA 指令 ， 它 的 操作 数 在 P2 中 。 操 作 系 统 
怎么 知道 J3 需要 把 P2 加 载 进 内 存 呢 ?因为 操作 系统 不 能 预测 未 来 ， 只 有 J3 实际 执行 到 
LDWA 语句 时 ， 它 才能 知道 这 一 点 。 

在 把 逻辑 地 址 翻译 为 物理 地 址 的 过 程 中 ,硬件 要 访问 J3 的 页 表 ， 以 确定 物理 地 址 的 帧 
号 。 因 为 加 载 位 为 N， 所 以 发 生 一 个 称 为 缺 页 (page fault) 的 中 断 。 操 作 系 统 会 干预 并 服务 
该 中 断 。 

当 缺 页 发 生 时 ， 操 作 系统 搜索 帧 表 ， 确 定 系统 中 是 否 还 有 空 的 帧 。 图 9-12 显示 帧 7 是 
可 用 的 ， 所 以 操作 系统 可 以 把 P2 加 载 到 该 帧 中 ， 再 更 新 帧 表 ， 记 录 帧 7 包含 J3 的 页 ， 也 更 
新 J3 的 页 表 ， 将 P2 记录 在 帧 7 中 ， 并 把 加 载 位 设置 为 Y。 

当 操 作 系 统 从 中 断 返 回 时 ， 它 会 把 程序 计数 器 设置 为 导致 缺 页 的 指令 地 址 ， 即 重新 执行 
该 指令 。 这 次 ， 当 硬件 访问 J3 的 页 表 时 ， 不 会 再 发 生 中 断 了 ，LDWA 指令 的 操作 数 会 被 放 
人 累加 器 中 。 

那么 ， 什 么 时 候 操作 系统 要 把 一 页 加 载 进 主 存 ?” 答案 很 简单 ， 就 是 当 程序 需要 它 的 时 
候 。 在 前 面 的 例子 中 ，J3 通过 缺 页 中 断 机 制 请 求 加 载 P2。 分 页 机 制 和 按 需 分 页 的 区 别 在 于 
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按 需 分 页 只 在 有 需求 的 时 候 才 把 页 载 和 内存 ， 如 果 从 来 不 需要 某 个 页 ， 那 么 就 永远 也 不 会 载 
AE. 


9.2.4 ”替换 页 


当 J3 需要 P2 被 加 载 时 ， 操 作 系统 没有 问题 ， 因 为 主 存 中 还 有 空 的 帧 。 不 过 假设 作业 请 
求 页 的 时 候 ， 所 有 帧 都 被 填 满 了 ， 这 时 ， 操 作 系统 必须 选择 一 个 已 经 加 载 进 来 的 页 ， 把 它 替 
换 出 去 ， 释放 它 的 帧 给 新 请 求 的 页 。 

被 替换 的 页 之 后 可 能 还 会 加 载 ， 并 可 能 加 载 到 不 同 帧 中 。 要 保证 再 次 加 载 的 状态 和 替换 
前 的 状态 相同 ， 操 作 系 统 可 能 需要 保存 页 的 状态 ， 在 页 被 蔡 换 时 把 它 写 回 磁盘 。 在 有 些 情况 
下 ， 也 可 能 在 被 替换 时 不 必 把 页 写 回 磁盘 。 

图 9-12 中 ,1 有 10 页 存储 在 磁盘 上 ， 其 中 3 页 已 经 加 载 进 了 主 存 。 当 J]1 执行 LDWA 
和 ASLA 这 样 的 指令 时 ， 不 会 修改 主 存 中 页 的 状态 。LDWA 引发 一 个 内 存 读 ， 并 把 操作 数 
放 进 累加 器 中 。ASLA 会 改变 累加 器 的 值 ， 该 动作 不 涉及 内 存 读 或 内 存 写 。 这 两 条 指令 都 不 
会 引起 内 存 写 。 

BEH JI 执行 像 STWA 这 样 的 指令 时 ， 会 改变 主 存 中 页 的 状态 。STWA 把 累加 器 的 内 
容 放 在 操作 数 的 位 置 上 ， 在 进程 中 进行 内 存 写 。 如 果 操 作 数 在 帧 4 POP, PO 在 主 存 中 的 
状态 就 会 改变 。 磁 盘 上 的 P0 页 和 主 存 中 当前 的 P0 就 不 完全 一 致 了 。 如 果 没 有 执行 过 存储 
指令 ， 那么 该 页 在 磁盘 上 的 映像 和 主 存 中 该 页 的 副本 会 完全 一 样 。 

在 缺 页 发 生 时 ， 操 作 系统 会 选择 一 个 页 进行 替换 ， 如 果 磁 盘 上 的 映像 仍然 是 内 存 中 该 页 
的 一 个 副本 ， 那 么 就 不 需要 把 该 页 写 回 磁盘 。 为 了 帮助 操作 系统 决定 是 否 需要 写 回 ， 帧 表 的 
硬件 中 包含 了 一 个 特殊 位 一 一 脏 位 。 

当 页 被 初次 加 载 到 空 帧 中 时 ， 操 作 系统 把 脏 位 设置 为 0， 在 图 9-12 中 用 N 表示 。 如 果 
有 存储 指令 引起 写 内 存 ， 硬 件 会 把 该 帧 的 脏 位置 为 1， 在 图 中 用 YY 表示 。 称 这 样 的 页 为 脏 
页 ， 是 因为 它 已 经 不 再 处 于 原始 的 干净 状态 。 如 果 选 择 替 换 某 个 页 ， 操 作 系统 会 检查 脏 位 ， 
决定 是 否 必须 在 用 新 页 覆盖 该 帧 之 前 把 该 页 写 回 磁盘 。 


9.2.5 页 替换 算法 


在 按 需 分 页 系统 中 ， 操 作 系 统 有 两 项 内 存 管 理 任务 : 给 作业 分 配 帧 ， 以 及 当 发 生 缺 页 且 
所 有 帧 都 满 了 时 ， 选 择 蔡 换 的 页 。 

一 种 合理 的 帧 分 配 策略 是 假设 大 作业 需要 比 小 作业 更 多 的 帧 ， 系 统 可 以 按 比例 分 配 帧 。 
如 果 JI 是 J2 的 两 倍 ， 则 执行 时 需要 的 帧 就 应 该 是 J2 的 两 倍 。 

假设 作业 执行 时 的 帧 数 是 固定 的 ， 操 作 系统 怎么 决定 缺 页 发 生 且 该 作业 的 所 有 帧 都 满 了 
时 ， 该 替换 哪个 页 呢 ? 两 种 可 行 的 页 替换 算法 是 先进 先 出 (First In, First Out, FIFO) 和 最 
近 最 少 被 使 用 (Least-Recently Used, LRU). 

图 9-13 展示 的 是 FIFO 页 替换 算法 的 行为 ， 在 这 个 系统 中 一 个 作业 被 分 配 了 三 个 帧 。 当 
作业 执行 时 ，CPU 向 主 存 发 送 连 续 的 读 写 请 求 流 。 每 个 地 址 的 第 一 组 位 是 页 号 ， 如 图 9-9 和 
9-10 所 示 。 页 引用 是 执行 作业 所 产生 的 页 号 序列 。 

图 9-13 表明 在 第 一 个 请 求 发 生前 有 三 个 空 页 可 用 。 作 业 请 求 P6 时 发 生 缺 页 ， 在 图 中 用 
F 表示 ， 然 后 P6 被 加 载 进 一 个 帧 中 。 

当 作业 请 求 P8 时 又 发 生 缺 页 ，P8 被 加 载 到 一 个 空 巾 中。 图 中 的 方 框 不 表示 某 个 特 指 的 
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i, FY OL P6 向 下 移动 了 一 个 方 框 以 放 入 P8， 在 实际 计算 机 中 ，P6 是 不 会 移动 到 另 一 个 帧 
中 的 。 


第 -区 人 页 引用 
梧 国 国 国 国 回回 回回 回回 回 La 
=} Ce] Pe) ee) GI GT el el] ey a 
=} El tl fl Cd Gl) GIG) od Cel Ce) oe 
E FF F F F F È 


图 9-13 ”使 用 三 个 帧 的 FIFO 页 替换 算法 


对 P3 的 引用 会 再 次 引发 缺 页 ， 但 是 接 下 来 对 P8 的 引用 就 不 会 了 ， 因 为 P8 仍然 在 加 载 
页 集合 中 。 类 似 地 ， 对 P6 的 引用 也 不 会 产生 缺 页 。 

对 PO 的 引用 会 导致 缺 页 中 断 ， 响 应 该 中 断 必 须要 选择 一 个 替换 页 。FIFO 算法 会 替换 最 
先进 入 帧 集合 的 页 。 因 为 图 中 把 已 有 的 页 往 下 移 ， 然 后 放 入 新 的 页 ， 所 以 最 先 加 载 的 页 在 底 
部 ， 即 P6。 操 作 系统 会 用 PO 替换 PO. 

当 作 业 有 三 个 帧 时 ， 给 定 的 12 个 页 引用 引发 了 7 次 缺 页 。 如 果 作 业 有 更 多 的 帧 ， 页 引 
用 序列 应 该 会 产生 更 少 的 缺 页 。 图 9-14 给 出 的 是 FIFO 算法 对 同一 个 页 引用 序列 但 是 有 四 个 
帆 的 执行 情况 。 如 预期 的 那样 ， 这 个 序列 产生 的 缺 页 次 数 较 少 。 
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图 9-14 使 用 4 个 帧 的 FIFO 页 替换 算法 


通常 来 说 ， 如 果 帧 数 增 加 ， 缺 页 次 数 会 减少 ， 如 图 9-15a 所 示 ， 像 前 面 两 个 例子 说 明 的 
那样 。 不 过 在 按 需 分 页 系统 发 展 的 早期 ， 人 们 发 现 了 一 个 很 奇怪 的 现象 ， 对 于 一 个 给 定 的 页 
引用 序列 ，FIFO 页 替换 算法 实际 上 可 能 在 使 用 更 多 帧 的 情况 下 ， 却 产生 更 多 的 缺 页 。 
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a) 更 多 帧 数 对 缺 页 数 的 预期 影响 b) FIFO 替换 算法 的 Belady 异常 
图 9-15 ” 帧 数 对 缺 页 次 数 的 影响 
具有 这 样 属性 的 页 引用 序列 是 
0, 1,2,3,0; 1,4; 0 12,34 
图 9-15b 是 该 序列 帧 数 与 缺 页 次 数 的 关系 图 ， 结 果 显 示 4 AMA k RE 3 个 帧 更 多 。 
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这 种 现象 称 为 Belady 异常 (Belady's anomaly)， 是 根据 发 现 者 工 .A. Belady 的 名 字 命 名 的 。 

FIFO 算法 选择 在 帧 集合 里 存在 时 间 最 长 的 页 ， 这 看 上 去 是 个 合理 的 标准 。 当 作业 执行 
时 ， 会 进入 新 的 代码 和 数据 区 域 ， 来 自 旧 区域 的 页 就 不 再 需要 了 ， 所 以 会 替换 最 老 的 页 。 

但 是 再 仔细 想 想 ， 考 虑 页 最 近 一 次 被 引用 距离 当前 的 时 间 比 考虑 页 已 经 在 帧 集合 里 的 时 
间 可 能 更 好 一 些 。LRU 背后 的 思想 是 ， 最 近 引 用 的 页 比 未 引用 的 页 更 可 能 在 不 远 的 将 来 被 
引用 。 

图 9-16 说 明 的 是 对 图 9-13 中 同样 的 页 引用 序列 ，LRU 页 替换 算法 是 怎样 工作 的 。 请 求 
P6、P8 和 P3 会 得 到 同 FIFO 算法 一 样 的 状态 。 接 下 来 请 求 P8 会 把 该 页 带 到 顶部 的 方 框 里 ， 
表明 P8 现在 是 最 近 使 用 过 的 。 后 续 的 请 求 P6 会 把 Po 带 到 顶部 ,把 P8 和 P3 往 下 移 。 图 中 
的 方 框 按照 前 面 的 使 用 顺序 排序 ， 最 远 被 使 用 的 页 在 底部 。 
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图 9-16 使 用 三 个 帧 的 LRU 页 替换 算法 


对 于 这 个 序列 ，LRU 算法 产生 的 缺 页 比 FIFO 算法 少 一 个 ， 不 过 一 个 例子 并 不 能 说 明 
LRU 优 于 FIFO， 因 为 也 有 可 能 构造 出 一 个 序列 ， 使 FIFO 产生 的 缺 页 次 数 比 LRU 少 。 

实际 中 ， 操 作 系 统 根据 具体 计算 机 可 用 的 硬件 特性 会 有 独特 的 页 替换 算法 。 大 多 数 的 页 
蔡 换 算法 都 类 似 于 LRU， 对 于 真实 作业 的 页 请 求 序列 ，LRU 的 效果 通常 比 FIFO 更 好 。 从 
理论 上 看 LRU 更 好 一 些 的 一 个 证 明 就 是 Belady 异常 不 会 发 生 在 LRU 替换 中 。 

前 面 例 子 中 的 页 引用 序列 只 说 明了 页 替换 算法 ， 这 并 不 实际 。 对 于 一 个 按 需 分 页 的 系 
统 ， 要 想 高 效 ， 缺 页 率 必须 保持 在 每 100 000 次 内 存 引用 中 会 有 大 约 一 次 缺 页 。 

一 个 设计 合理 的 、 基 于 按 需 分 页 的 虚拟 内 存 系统 能 够 满足 操作 系统 的 两 个 目标 。 它 为 高 
级 编程 提供 了 方便 的 环境 ， 因 为 程序 员 编写 代码 时 不 需要 受到 物理 内 存 的 限制 。 另 一 方面 ， 
它 能 高 效 地 分 配 内 存 ， 因 为 只 有 在 需要 的 时 候 ， 作 业 的 页 才 会 加 载 进 内 存 。 


9.3 文件 管理 


操作 系统 还 要 负责 维护 磁盘 上 的 文件 。 文 件 是 一 种 抽象 数据 类 型 (ADT)。 对 于 系统 的 用 户 
来 说 ， 文 件 包含 数 据 序 列 ， 可 以 由 程序 或 者 操作 系统 命令 进行 管理 。 对 文件 常用 的 操作 包括 : 

e 创建 新 文件 

。 删除 文件 

e 重 命名 文件 

o 打开 文件 进行 读 

© 从 文件 读 出 下 一 块 数据 

操作 系统 要 连接 起 HOL6 层 或 Asmb5 层 程序 员 看 到 的 文件 的 逻辑 组 织 和 文件 在 磁盘 上 
的 物理 组 织 。 


9.3.1 磁盘 驱动 器 
图 9-17 展示 的 是 磁盘 驱动 器 的 物理 特性 。 图 9-17a 说 明 硬 盘 驱 动 器 是 由 几 个 覆盖 着 磁 
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记录 物质 的 盘 片 组 成 的 ， 盘 片 附着 在 中 央 转 轴 上 ， 转 轴 通 常 以 每 分 钟 7200 转 的 速度 旋转 。 
靠近 每 个 磁盘 表面 的 地 方 有 一 个 读 / 写 头 ， 它 连接 到 一 个 机 械 辟 ,机 械 臂 可 以 在 盘 片 表面 沿 
着 半径 方向 移动 读 / 写 头 。 

机 械 臂 





a) 硬盘 驱动 器 


图 9-17 ”磁盘 驱动 器 的 物理 特性 


9-17b 给 出 的 是 一 个 单独 的 磁盘 。 如 果 机 械 臂 固定 在 一 个 位 置 ， 那 么 当 磁盘 旋转 时 ， 
读 / 写 头 下面 扫 过 的 区 域 形 成 一 个 环 。 每 个 环 是 一 个 磁道 ， 它 存储 着 位 序列 。 磁 道 又 划分 成 
馅 饼 (pie) 形状 的 扇 区 。 块 是 一 个 盘 片 表面 的 一 个 磁道 的 一 个 鹿 区 。 柱 面 是 机 械 臂 位 置 固定 
在 某 个 位 置 时 ， 所 有 盘 片 表 面 上 对 应 磁道 的 集合 。 块 地 址 包括 三 个 组 成 部 分 : FEMS. BA 
表面 号 和 扇 区 号 。 

在 硬盘 驱动 器 中 ， 读 / 写 头 是 浮 在 表面 之 上 的 ， 中 间 有 一 小 层 空气 执 。 硬 盘 中 的 磁头 碰 
4@ (head crash) 是 机 械 故 障 ， 磁 头 擦 到 了 盘 片 表面 ， 破 坏 记 录 物 质 。 

从 给 定 的 块 读 出 信息 的 过 程 分 为 四 步 : 1 ) 机 械 臂 把 读 / 写 头 移动 到 指定 柱 面 ; 2) 电 
子 电路 选择 指定 盘 片 表面 对 应 的 读 / 写 头 ; 3 ) 等 待 一 段 时 间 ， 等 指定 块 移动 到 读 / 写 头 下 ; 
4) 读 一 个 块 必须 要 求 整个 块 经 过 读 / 写 头 。 第 2 步 是 一 个 电子 功能 ， 相 比 起 其 他 3 个 步 又， 
发 生 的 时 间 可 以 忽略 不 计 。 

与 3 个 机 械 步骤 相对 应 的 时 间 分 别 是 : 

e iH AYA] 

o 延迟 

e 传输 时 间 

寻 道 时 间 (seek time) 是 机 械 辟 移动 到 指定 柱 面 花费 的 时 间 ， 延迟 (latency) 是 读 / 写 头 
到 位 之 后 块 到 达 读 / 写 头 的 时 间 ; 而 传输 时 间 (transmission time) 是 块 经 过 读 / 写 头 的 时 间 。 
访问 一 个 块 所 需 的 时 间 是 这 三 段 时 间 之 和 。 


9.3.2 文件 抽象 


在 较 高 抽象 层次 上 的 用 户 不 需要 担心 物理 磁道 和 扇 区 。 操 作 系统 要 隐藏 物理 组 织 的 细 
节 ， 只 向 用 户 展示 文件 的 逻辑 组 织 ， 把 文件 作为 一 种 ADT。 
例如 ,在 C 中 执行 如 下 语句 
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fscanf (fp, "%d", &myData) 


这 里 fp 的 类 型 是 FILE*+ ， 可 以 把 fp 逻辑 上 看 成 数据 项 的 线性 序列 ， 当 前 位 置 处 于 序列 中 的 
某 个 位 置 。 函 数 fscanf() 获取 在 当前 位 置 的 数据 项 ， 再 把 当前 位 置 向 前 移 到 序列 中 下 一 个 数 
据 项 处 。 

物理 上 ， 文 件 中 的 数据 项 可 以 在 不 同 的 磁道 和 盘 片上 ， 而 且 ， 硬 件 不 维护 当前 物理 位 
置 ， 读 语句 的 逻辑 行为 是 由 操作 系统 软件 控制 的 。 


9.3.3 分配 技术 


本 节 最 后 将 讲述 三 种 物理 层 上 的 存储 分 配 技 术 : 连续 、 链 接 和 索引 。 每 种 技术 都 要 求 操 
作 系 统 维护 一 个 目录 ， 记 录 文 件 的 物理 位 置 。 这 个 目录 和 其 他 文件 一 起 存储 在 磁盘 上 。 

如 果 每 个 文件 都 足够 小 并 能 装 进 一 个 块 中 ,那么 文件 系统 维护 起 来 就 很 简单 ， 目 录 只 需 
包含 磁盘 上 所 有 文件 的 列表 ， 目 录 中 的 每 个 表 项 会 记录 文件 的 名 字 和 文件 存储 的 块 的 地 址 。 

如 果 文 件 太 大 不 能 装 进 一 个 块 中 ,那么 操作 系统 必须 为 它 分 配 多 个 块 。 采 用 连续 分 配 
(contiguous allocation) 时 ， 操 作 系 统 要 使 文件 的 物理 组 织 与 逻辑 组 织 匹 配 ， 把 文件 连续 地 放 
在 一 个 磁道 相 邻 的 块 中 。 

如 果 文 件 太 大 放 不 进 一 个 磁道 中 ， 系 统 会 继续 往 第 二 个 磁道 里 放 。 在 单 面 磁盘 中 ， 第 二 
个 磁道 在 同一 个 盘面 上 与 第 一 个 磁道 相 邻 。 在 双 面 磁盘 中 ， 第 二 个 磁道 在 第 一 个 磁道 的 同一 
柱 面 上 。 如 果 文 件 还 是 太 大 装 不 进 一 个 柱 面 ， 则 将 文件 继续 放 在 相 邻 的 柱 面 上 。 

图 9-18 是 连续 分 配 的 示意 图 。 每 一 行 8 个 块 代表 每 个 磁道 分 为 8 个 扇 区 ， 和 图 9-17b 
一 样 。 每 个 块 上 的 数字 是 块 地 址 ， 是 指定 块 地 址 所 需 三 个 数字 的 简写 形式 。 块 0 包含 目录 。 


文件 起 始 地 址 大 小 
TermPaper 
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图 9-18 磁盘 上 的 连续 分 配 


目录 列 出 了 每 个 文件 的 名 字 、 起 始 地 址 和 大 小 。 文 件 TermPaper 从 块 5 开始， 包括 6 个 
块 ， 最 后 三 个 块 从 第 二 个 磁道 继续 。 系 统 为 什么 不 把 块 1 ~ 6 分 配给 该 文件 呢 ? 如 果 另 一 个 
文件 先前 占用 了 块 1 ~ 4， 然 后 又 被 用 户 从 磁盘 删除 了 ， 就 可 能 出 现 图 中 所 示 的 情况 。 

图 9-18 中 占用 和 未 占用 的 磁盘 存储 模式 非常 类 似 于 图 9-5 和 9-7 中 占用 和 未 占用 的 主 存 
模式 。 实 际 上 存储 管理 的 问题 都 是 一 样 的 。 当 文件 创建 后 被 删除 ， 存 储 都 会 出 现 碎 片 。 有 可 
能 因为 有 太 多 分 散在 磁盘 上 的 小 洞 而 无 法 创建 一 个 新 文件 。 为 了 给 新 文件 腾 出 空间 ， 操 作 系 
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统 提供 磁盘 合并 工具 ， 用 来 移动 磁盘 上 的 文件 以 制造 出 一 个 大 的 洞 ， 如 图 9-6 所 示 。 

和 主 存 一 样 ， 磁 盘 的 合并 操作 也 是 非常 耗 时 的 。 为 了 避免 合并 ， 操 作 系统 可 以 把 文件 存 
储 在 物理 上 分 散在 磁盘 上 的 块 中 。 图 9-19 中 的 链接 分 配 技术 就 是 系统 用 以 维护 这 类 文件 的 
一 种 方式 。 


目录 
TermPaper 5 
MailingList 18 ced 





图 9-19 磁盘 上 的 链接 分 配 


这 个 目录 包含 文件 第 一 块 的 地 址 。 每 个 块 的 最 后 几 个 字 节 保留 给 下 一 块 的 地 址 。 整 个 块 
序列 形成 了 一 个 链表 。 最 后 一 个 块 的 链接 字段 值 为 空 (nil)， 作 为 标记 字符 。 

链接 技术 的 一 个 缺点 是 很 容易 受到 故障 的 影响 。 在 图 9-19 中 ， 因 为 硬件 故障 或 是 软件 
漏洞 块 ， 假 设 块 12 的 链接 字段 中 有 一 个 字 节 被 破坏 了 。 那么 ， 操 作 系统 还 能 访问 文件 的 前 
三 块 ， 但 是 没有 办 法 知道 后 三 块 在 哪里 。 

图 9-20 中 的 索引 分 配 技术 把 所 有 地 址 都 放 进 目录 里 一 个 称 为 索引 (index) 的 链表 中 ， 
这 样 一 来 ， 即 使 索引 中 地 址 12 中 的 一 个 字 节 损坏 了 ， 操 作 系统 只 会 丢失 那 一 个 块 。 


文件 块 
TermPaper SR 12; 


14, 23, 20 





MailingList 18, 19,2 an 





图 9-20 磁盘 上 的 索引 分 配 
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连续 分 配 相 对 于 非 连续 分 配 的 主要 优点 是 速度 。 如 果 文 件 存储 在 一 个 柱 面 中 ， 就 只 需要 
在 开始 访问 时 等 待 寻 道 和 延迟 时 间 ， 整 个 文件 的 读 取 速度 只 受到 传输 时 间 的 制约 。 即 使 文 
件 不 止 在 一 个 柱 面 上 ， 在 读 完 第 一 个 柱 面 后 ， 也 只 需要 等 一 个 很 短暂 的 、 到 相 邻 柱 面 的 寻 道 
时 间 。 

如 果 一 个 文件 的 块 分 散在 整个 磁盘 上 ， 则 每 访问 一 个 块 都 需要 经 历 寻 道 时 间 和 延迟 时 
间 。 即 使 是 使 用 非 连续 分 配 策略 ， 定 期 重新 组 织 一 下 文件 的 物理 布局 ， 使 块 尽量 连续 ， 也 是 
很 值得 的 。 这 个 操作 称 为 磁盘 清理 (defragmenting). 


9.4 ”错误 检测 与 纠 错 码 


要 想 可 靠 ， 计 算 机 系统 必须 能 够 处 理 物 理 错误 ， 这 在 真实 世界 里 是 不 可 避免 的 。 例 如 ， 
如 果 你 通过 因特网 发 送 了 一 封 电子 邮件 ， 传 输 线路 上 的 一 些 静 电 可 能 会 改变 一 个 或 几 个 位 ， 
结果 接收 者 收 到 的 位 模式 和 你 发 送 的 不 完全 一 致 。 再 举 个 例子 ， 系 统 从 主 存 发 送 一 些 数 据 到 
磁盘 驱动 器 ， 由 于 短暂 的 机 械 问 题 ， 存 储 到 磁盘 上 的 位 模式 可 能 会 改变 。 

对 于 这 类 错误 有 两 种 解决 方法 : 

。 检测 错误 并 重 传 或 丢弃 接收 到 的 消息 

o 纠正 错误 

这 两 种 方法 使 用 的 都 是 给 消息 增加 宛 余 位 的 技术 ， 用 以 检测 或 纠正 错误 。 


9.4.1 错误 检测 码 


假设 想 要 传送 一 条 有 关 天 气 情 况 的 消息 ， 有 四 种 可 能 性 : 晴朗 、 多 云 、 下 雨 和 下 雪 。 发 
送 者 和 接收 者 约定 好 用 下 面 的 位 模式 来 对 信息 编码 : 

00, fA FA 

01, #4 

10, Frm 

ll, FS 

如 果 下 十 ,发 送 者 就 发 送 10。 但 是 在 传输 线 上 最 后 的 0 跳 变 成 1， 那 么 接收 者 收 到 11, 
会 错误 地 认为 是 下 雪 。 

检测 是 否 发 生 了 错误 最 简单 的 方法 是 ， 使 用 发 送 者 和 接收 者 共同 确认 的 某 种 计算 方法 向 
消息 中 添加 一 个 元 余 位 ， 称 为 奇偶 位 parity bit)。 最 常见 的 方法 是 设置 奇偶 位 为 0 或 1, 使 
得 1 的 总 数 为 偶数 。 采 用 这 种 方法 ， 发送 者 和 接受 者 同意 使 用 下 述 位 模式 ， 其 中 奇偶 位 用 下 
划 线 标明 : 

000, tA 

011, 4% 

101, Fm 

110, Ff 

现在 假设 发 送 者 发 送 101 的 下 雨 消息 。 如 果 出 现 错误 把 0 变 成 了 1， 那么 接收 者 会 收 到 
111， 并 知道 发 生 了 错误 ， 因 为 111 不 是 一 个 事先 确定 好 的 位 模式 。 接 收 者 可 以 请 求 重 传 ， 
或 者 丢弃 收 到 的 消息 。 

注意 ， 错 误 发 生 在 奇偶 位 和 错误 发 生 在 某 个 数据 位 一 样 ， 接 收 的 消息 都 是 没有 用 的 。 例 
如 ， 如 果 接 收 者 收 到 111， 他 不 知道 错误 发 生 在 发 送 011 时 第 1 位 错 了 ， 还 是 发 送 101 时 第 
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2 位 错 了 ， 抑 或 是 发 送 110 时 第 3 位 错 了 ， 他 只 知道 发 生 了 错误 。 

发 送 者 和 接收 者 也 可 商量 使 用 奇 校 验 。 奇 校 验 是 指 校 验 位 的 计算 是 为 了 让 1 的 总 数 为 奇 
数 。 对 于 发 送 者 和 接收 者 来 说 ， 他 们 只 需要 决定 采用 什么 样 的 奇偶 计算 。 

如 果 传 输 中 出 现 了 两 个 错误 会 怎么 样 呢 ? 比如 不 仅 是 0 变 成 1， 而 且 最 后 一 个 1 也 变 成 
了 10， 接收 者 收 到 110。 但 是 现在 110 是 一 个 约定 好 的 模式 ， 那 么 接收 者 会 错误 地 认为 该 消 
息 是 下 雪 的 意思 。 

位 模式 的 集合 {000, 011, 101, 110} 称 为 编码 (code)， 集 合 中 一 个 单独 的 模式 (例如 
101) 称 为 编码 字 ( code word)。 上 述 编码 不 能 发 现 两 位 错 ， 它 是 一 位 错 检 测 编 码 。 错 误 编 
码 会 基于 一 个 很 现实 的 假设 ， 即 发 生 一 位 错 的 概率 要 远 远 小 于 1.0， 因 而 发 生 两 位 错 的 概率 
要 远 远 小 于 发 生 一 位 错 的 概率 。 没 有 哪 种 编码 能 100% 肯定 检测 出 所 有 错误 ， 因 为 总 有 可 能 
同时 出 现 多 个 错误 刚好 把 一 个 编码 字 变 为 另 一 个 编码 字 。 错 误 码 仍然 有 用 ， 因 为 它们 能 处 理 
大 部 分 错误 事件 。 


9.4.2 ”编码 要 求 


假设 要 检测 一 位 或 两 位 错 ， 显 然 需 要 更 多 的 奇偶 位 。 问 题 是 “需要 多 少 奇 偶 位 ?” 并 且 
“该 如 何 设计 编码 呢 ?” 和 案 涉及 一 种 距离 的 概念 。 两 个 长 度 相 同 的 编码 字 之 间 的 海 明 距 离 
(hamming distance) 定义 为 它们 位 不 相同 的 位 置 的 个 数 。 这 是 根据 Richard Hamming 的 名 字 
命名 的 ，1950 年 他 在 贝尔 实验 室 研 究 并 得 出 了 这 项 理论 。 

GED 编码 字 多 云 011 和 下 雨 101 之 间 的 海 明 距 离 是 2， 因 为 它们 有 两 个 位 置 上 的 位 
不 相同 ， 即 第 一 位 和 第 二 位 。 m 

看 看 天 气 编码 {000, 011, 101, 110} 可 以 发 现 ， 所 有 两 个 代码 字 之 间 的 距离 都 是 2。 可 见 
能 够 检测 一 位 错 的 编码 ， 两 个 代码 字 之 间 的 距离 不 能 为 1。 假设 有 这 样 两 个 编码 字 A M B, 
如 果 发 送 者 发 送 A， 传输 中 发 生 了 一 位 错 ， 把 A 和 B 不 同 的 那 一 位 反 转 了 ， 接 收 者 会 以 为 
发 送 的 是 B。 该 编码 无 法 检测 出 这 样 的 一 位 错 。 

编码 距离 (code distance) 是 编码 中 任意 一 对 编码 字 之 间 最 小 的 海 明 距 离 。 

GEÐ 编码 (00110, 11100, 01010, 11101} 的 编码 距离 为 1。 虽然 几 个 编码 字 之 间 的 
距离 不 全 为 1， 例如 00110 和 11101 的 海 明 距 离 为 4， 但 是 有 一 对 字 之 间 的 距离 仅 为 1， 即 
11100 和 11101。 如 果 用 这 个 编码 发 送 天 气 信息 ， 还 是 不 能 保证 能 够 发 现 所 有 可 能 的 一 位 传 
输 错 误 。 a 

要 设计 一 个 好 的 编码 ， 添 加 奇偶 位 的 方法 要 使 得 
编码 距离 尽 可 能 大 。 要 想 发 现 一 位 错 ， 编 码 距离 必须 








至 少 为 2。 如 果 要 发 现 两 位 错 ， 编 码 距 离 应 该 为 多 少 

WE? 不 能 为 2， 因 为 那 意味 着 存在 一 对 编码 字 A 和 B a 

之 间 的 海 明 距 离 为 2， 如 果 发 送 者 发 送 A， 传 输 中 出 现 a) 一 位 错误 检测 

的 错误 刚好 把 使 得 A 区 别 于 B 的 两 位 反 转 ， 接 收 者 就 

会 以 为 发 送 的 是 B。 > w a D 
图 9-21 是 这 个 概念 的 示意 图 。A 是 发 送 的 编码 字 ， +p eoo 

B 是 最 接近 A 的 编码 字 ， 两 者 之 间 的 空心 圆 表示 并 未 | 3 | 

发 送 但 是 由 于 传输 错误 有 可 能 接收 到 的 字 。 图 9-21a b) 两 位 错误 检测 


中 ， 发 生 一 位 错 可 能 出 现 el， 图 9-21b 中 一 位 错 会 出 图 9.21 错误 检测 码 的 最 小 海 明 距 离 
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现 el ， 两 位 错 会 出 现 e2。 

总 的 来 说 ， 要 发 现 4 位 错 ， 编 码 距 离 必须 满足 如 下 公式 

编码 距离 =d+1 

例如 ,要 检测 三 位 错 ， 编 码 距 离 必须 至 少 为 4， 原 因 是 距离 A 最 近 的 字 至 少 为 4+1， 那 
么 就 不 可 能 反 转 A 的 4d 位 把 它 变 成 另 一 个 编码 字 。 

距离 的 概念 对 纠 错 码 也 有 用 。 假 设 对 天 气 消 息 采 用 如 下 编码 : 

00000, Hy BA 

01101, 4% 

10110, Fm 

11011, FẸ 

如 果 收 到 11110， 如 何 判 断 ?” 可 以 说 发 送 的 是 00000 (晴朗 )， 发 生 了 四 位 错 。 但 是 这 是 
一 个 合理 的 结论 么 ? 不 是 ， 因 为 11110 更 接近 10110, 这 是 下 十 的 编码 字 。 如 果 这 样 判 断 ， 
假设 的 就 是 发 生 了 一 位 错 ， 发 生 一 位 错 的 概率 要 远 高 于 发 生 四 位 错 的 概率 。 

一 般 来 说 ， 设 计 纠 错 编 码 要 添加 足够 多 的 奇偶 位 ， 使 得 编码 距离 足够 大 ， 这 样 接收 者 才 
能 纠正 错误 。 接 收 者 纠 错 的 方法 是 计算 收 到 的 字 和 每 个 编码 字 的 海 明 距 离 ， 选 择 最 接近 接收 
到 的 字 的 编码 字 ， 这 里 的 “ 近 ” 是 通过 海 明 距 离 来 定义 的 。 

图 9-22 是 纠 错 概念 的 示意 图 。 同 前 面 一 样 , A 是 发 送 的 编码 字 ,B 是 最 接近 A 的 编码 字 ， 
空心 圆 是 由 于 传输 错误 而 接收 到 的 字 。 图 9-22a 给 出 的 情况 是 编码 能 够 纠正 一 位 错 。 编 码 
距离 是 3， 所 以 即使 出 现 了 一 位 错 ， 接 收 到 的 el 仍然 距离 A 比 距 离 B 更 近 ， 所 以 接收 者 会 
ree 如 果 发 送 A， 并 且 出 现 两 位 错 ， 收 到 了 e2 ， 接 收 者 会 错误 地 认为 发 送 的 
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pem 3 ———__> | 5 一 | 


(a) 一 位 错误 检测 (b) 两 位 错误 检测 
图 9-22 ” 纠 错 码 的 最 小 海 明 距 离 


图 9-22b 展示 的 是 能 够 纠正 两 位 错 的 编码 。 如 果 发 送 A 且 出 现 两 位 错 ， 则 收 到 e2 ，e2 
距离 A E B 更 近 。 只 有 当 距 离 为 5 时 才能 做 到 纠正 两 位 错 。 

总 的 来 说 ， 要 纠正 4 位 错 ， 编 码 距 离 必 须 满足 下 面 的 公式 

编码 距离 =24+1 

例如 ， 要 纠正 三 位 错 ， 编 码 距 离 必 须 至 少 为 7。 这 是 由 接收 方 的 决定 过 程 导致 的 : 如果 
接收 方 收 到 的 字 接 近 A， 就 认为 发 送 的 是 A， 而 接收 到 的 字 接 近 B， 就 认为 发 送 的 是 B。A 
和 B 之 间 的 距离 必须 能 够 容纳 这 两 组 接收 到 的 字 ， 这 也 就 是 公式 中 4d 乘 以 2 的 原因 。 同 时 
距离 也 必须 是 奇数 ， 所 以 公式 中 要 +1。 如 果 距 离 是 偶数 ， 就 会 出 现 接收 到 的 字 离 A M B — 
样 远 ， 那 么 接收 者 就 没有 办 法 判断 发 送 哪个 字 的 概率 比较 高 了 。 

纠正 一 位 错 的 编码 同样 可 以 用 来 检测 两 位 错 ， 因 为 它们 的 编码 距离 都 是 3。 这 取决 于 接 
收 者 想 怎 样 处 理 错误 。 可 以 假设 没有 发 生 两 位 错 并 纠正 这 个 错误 ， 也 可 以 更 保守 一 些 ， 假 设 
可 能 发 生 了 两 位 错 ， 丢 弃 该 消息 或 者 请 求 重 传 。 
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9.4.3 ”纠正 一 位 错误 编码 


前 面 一 节 中 我 们 描述 了 检测 和 纠正 错误 编码 所 需要 的 编码 距离 。 还 有 一 个 问题 是 如 何 挑 
选编 码 字 以 满足 要 求 的 编码 距离 。 实 际 上 人 们 已 经 设计 出 了 许多 不 同 的 能 够 纠正 多 位 错误 的 
编码 方案 ， 本 节 将 讨论 纠正 一 位 错误 编码 的 效率 并 讲解 一 种 构建 此 类 编码 的 系统 方法 。 
图 9-23a 给 出 了 一 个 编码 字 的 结构 ， 有 m 个 数据 位 和 + 个 奇偶 位 ， 该 编码 字 共 n=m+tr 
位 。 编 码 字 如 果 是 n 位 ， 那 么 接收 到 可 能 的 位 模式 有 2" 种。 图 9-23b 是 一 种 分 类 方案 ， 可 
以 把 这 些 字 分 为 没有 错误 和 有 一 位 错误 的 类 。 图 中 给 出 的 是 n=6 时 的 情况 ，el、e2、e3、 
e4, e5 和 e6 是 六 种 可 能 收 到 的 字 ， 和 A 有 一 位 不 同 。 如 果 收 到 这 其 中 的 一 个 ， 接 收 者 会 认 
559| 为 发 送 的 是 A。 类 似 地 ，e7、e8、e9、e10、ell Mel2 是 与 B 距离 为 1 的 可 能 收 到 的 字 。 也 
有 可 能 收 到 其 他 不 包含 在 这 些 组 里 的 字 ， 对 应 于 传输 中 出 现 多 于 一 个 位 错误 的 事件 ， 但 是 这 
种 情况 下 收 到 的 字 与 任何 编码 字 的 距离 不 会 小 于 等 于 1 。 
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a) 编码 字 结 构 b) 按 接收 字 有 0 位 或 
1 位 错误 的 分 组 


图 9-23 纠正 一 位 错误 编码 结构 


一 般 来 说 及 n 个 字 与 A 的 距离 为 1， 所 以 包括 A 在 内 第 一 组 中 字 的 总 数 是 (n+ 1 )。 类 
似 地 ，B 组 、C 组 里 也 都 有 (n+ 1) 个 字 ， 以 此 类 推 。 每 个 编码 字 有 一 个 组 ， 如 果 有 2” 个 
编码 字 ， 那 么 就 有 2” 个 组 ， 所 以 图 9-23b 中 字 的 总 数 为 (n+ 1) 2"。 可 能 还 有 其 他 一 些 收 
到 的 字 不 在 图 9-23b 中 ， 但 是 总 数 不 可 能 超过 2"。 因 此 ， 

(n+ 1)2" <2" 
用 n=m+r 进行 替换 ， 两 边 都 除 以 2”"， 得 到 
mt+r+1<2" 
这 个 公式 说 明了 在 具有 m 位 数据 位 的 消息 中 ， 要 纠正 一 位 错误 需要 多 少 个 奇偶 位 x。 

使 得 上 述 公 式 为 等 号 关系 的 编码 称 为 完美 编码 (perfect code)， 一 个 例子 就 是 m=4, 
/=3。 把 奇偶 位 和 数据 位 一 起 传输 增加 了 传输 时 间 ， 对 于 这 种 编码 ， 每 传 4 位 数据 ， 就 要 传 
额外 的 3 位 奇偶 位 。 所 以 ， 纠 错 码 增加 了 3/4 = 75% 的 传输 时 间 开 销 。 如 果 需 要 传输 一 个 很 
长 的 位 流 ， 就 要 把 流 分 割 成 很 多 块 ， 再 为 每 一 个 块 添 加 奇偶 位 。 块 越 大 ， 开 销 越 小 。 计 算 机 
总 是 在 发 送 字 节 流 ， 所 以 块 的 大 小 总 是 2 的 需 。 图 9-24 给 出 了 几 组 m 值 为 2 REET m Flr 

[560] 之 间 的 关系 。 
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海 明 设计 了 一 种 非常 聪明 的 方法 来 决定 纠正 一 位 错误 编码 的 奇偶 位 ， 它 的 思想 是 不 要 把 奇 
偶 位 放 到 编码 字 的 最 后 ， 而 是 把 它们 分 散 | 

SSS), BRA EM S| Beim SRo FARDE 
直接 计算 出 哪 一 位 出 错 ， 而 不 用 计算 接收 


到 的 字 与 所 有 编码 字 之 间 的 距离 。 图 9.25 3 时 
给 出 的 是 m=8，/=4 的 情况 下 奇偶 位 的 位 

置 。 位 的 位 置 从 左 往 右 依次 编号 ， 奇 偶 位 à A 
的 位 置 分 别 是 1、2、4、8， 即 2 的 寡 。 这 32 6 19 
里 的 示例 中 ,传输 的 数据 是 1001 1100, 64 7 11 
但 是 这 些 位 在 编码 字 中 不 是 连续 存储 的 。 128 8 6 


每 个 位 的 位 置 编 号 可 以 写成 唯一 的 2 
的 禾 相 加 之 和 ， 如 下 所 示 : 


图 9-24 纠正 一 位 错误 编码 的 开销 





1=1 5=1+4 9=148 123 45 6 7 8 9 WU 2 
2=2 6=2+4 10=2+8 

3=142 7=1+2+4 11=1+2+8 图 9-25 在 8 位 数据 位 的 纠正 一 位 错误 编码 中 4 位 
8=8 12=4+8 奇偶 位 的 位 置 分 布 


要 确定 在 位 置 1 的 奇偶 位 的 值 ， 注 意 
它 出 现在 位 置 1、3、5、7、9 和 11 的 求 和 公式 的 右边 。 使 用 偶 校 验 的 话 ， 要 把 该 奇偶 位 设 
置 为 使 得 这 些 位 置 中 1 的 总 个 数 为 偶数 。 位 置 3、7 和 9 是 1， 所 以 1 的 个 数 是 奇数 ， 因 此 
在 位 置 1 的 奇偶 位 的 值 应 该 设置 为 1。 每 个 奇偶 位 要 检测 的 位 置 分 别 是 : 

奇偶 位 1 4M) 1, 3, 5, 7, 9, 11 

奇偶 位 2 Ml 2, 3, 6, 7, 10, 11 

奇偶 位 4 检测 4，5，6，7，12 

奇偶 位 8 检测 8，9，10，11，12 

你 可 以 自己 计算 一 下 编码 字 中 其 他 几 个 奇偶 位 ， 验 证 结果 111100101100。 

现在 假设 发 送 了 该 编码 字 ， 在 传输 过 程 中 位 置 10 的 值 发 生 了 错误 ， 接 收 者 收 到 的 是 
111100101000， 据 此 计算 出 的 奇偶 位 为 101100111000， 可 以 看 出 位 置 2 和 8 上 接收 到 的 奇 
偶 位 和 计算 出 来 的 奇偶 位 是 不 同 的 。 因 为 2+8=10， 所 以 可 知 在 位 置 10 的 位 错 了 ， 把 位 置 
10 的 值 反 转 ， 就 纠正 了 错误 。 这 种 纠 错 技术 的 好 处 是 接收 者 不 需要 把 接收 到 的 字 与 所 有 编 
码 字 进行 比较 以 确定 它 离 哪 个 编码 字 最 近 。 
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在 计算 机 发 展 早期 ， 磁 盘 体积 大 且 昂 贵 。 随 着 技术 的 进步 ， 磁 盘 体积 变 小 ， 数 据 容 量 增 
加 ， 也 没有 那么 贵 了 ， 最 后 磁盘 变 得 非常 便宜 ， 要 存储 大 量 数据 时 ， 可 以 把 多 个 驱动 器 组 装 
成 一 个 驱动 器 阵列 ， 这 样 比 构造 一 个 超大 的 驱动 器 更 划算 。 这 样 的 驱动 器 组 合 称 为 廉价 磁盘 
宛 余 阵 列 (Redundant Array of Inexpensive Disks, RAID) 系统 。 

RAID 的 思想 是 相对 于 只 有 一 个 转轴 的 大 磁盘 驱动 器 来 说 ， 磁 盘 阵列 有 更 多 转轴 ， 每 个 
都 有 自己 的 一 组 读 / 写 头 ， 可 以 并 发 操作 ， 以 此 提高 性 能 。 同 时 ， 宛 余 也 可 以 用 来 纠正 和 检 
测 错误 ， 增 加 系统 的 可 靠 性 。RAID 控制 器 向 操作 系统 提供 了 一 层 抽 象 ， 使 得 磁盘 阵列 看 上 
去 像 一 个 很 大 的 磁盘 。 相 应 地 ， 也 可 以 由 软件 来 提供 这 层 抽 象 ， 作 为 操作 系统 的 一 部 分 。 
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组 织 磁盘 阵列 有 几 种 不 同 的 方式 ， 最 常见 方案 的 行业 标准 术语 是 : 
RAID 0 级 : 非 元 余 条 带 化 
RAID 1 级 : 镜像 
RAID 01 和 10 级 : 条 带 化 和 镜像 
RAID 2 级 : 内 存 风格 的 错误 校 验 码 (ECC) 
RAID 3 级 : 位 交叉 奇偶 校 验 
RAID 4 级 : 块 交 叉 奇 偶 校 验 
e RAID 5 级 : 块 交叉 分 布 奇 偶 校 验 
每 种 组 织 方式 都 有 各 自 的 优点 和 缺点 ， 适 用 于 不 同 的 场景 。 本 节 接 下 来 将 介绍 上 述 各 种 
等 级 的 RAID。 


9.5.1 RAID 0 级 : 无 元 余 条 带 化 


图 9-26 是 RAID 0 级 的 组 织 结构 。 本 来 应 该 存储 在 连续 块 中 的 数据 被 分 成 了 条 带 ， 分 布 
在 阵列 中 的 几 个 磁盘 上 。 图 9-18 中 块 0 ~ 7 在 一 条 磁道 上 ，8 ~ 15 在 下 一 条 磁道 上 ， 以 此 
类 推 。 一 个 条 带 包 括 几 个 块 ， 例 如 ， 如 果 每 个 条 带 2 个 块 ， 那么 图 9-18 中 的 块 0 和 块 1 存 
在 条 带 0 上 ， 块 2 和 块 3 存在 条 带 1 上 ， 以 此 类 推 。 





图 9-26 RAIDOR: 无 元 余 条 带 化 


操作 系统 看 到 的 是 图 9-18 所 示 的 逻辑 磁盘 ， 而 实际 物理 磁盘 如 图 9-26 所 示 。 如 果 操 作 
系统 请 求 磁 盘 读 块 0 一 7, RAID 系统 会 并 行 地 读 条 带 0 一 3， 并 发 可 降低 访问 时 间 。 如 果 
要 服务 一 个 读 块 0 ~ 10 的 请 求 ， 也 就 是 条 带 O~ 5， 则 第 一 块 磁盘 需要 顺序 传输 条 带 0 和 
条 带 4， 第 二 块 磁盘 也 同样 需要 顺序 传输 条 带 1 和 条 带 5。 这 样 的 组 织 架 构 需 要 至 少 两 块 
硬盘 。 

0 级 的 优点 是 提高 了 性 能 ， 但 是 如 果 大 多 数 读 / 写 请 求 的 都 是 同一 个 块 或 者 同一 个 条 带 ， 
0 级 的 问题 就 显现 出 来 了 ， 因 为 这 种 情况 下 没有 并 发 性 。 同 时 ， 它 也 不 像 其 他 级 一 样 有 宛 
余 ， 所 以 可 靠 性 不 是 很 高 。 假 设 所 有 磁盘 质量 都 相同 ,那么 四 块 磁盘 同时 运行 出 现 故障 的 概 
率 比 只 运行 一 块 磁盘 出 现 故障 的 概率 要 高 。 


9.5.2 RAID 1 级 : 镜像 


对 磁盘 做 镜像 是 指 在 男 一 块 独立 的 磁盘 上 维护 这 块 磁盘 的 
完全 一 致 的 映像 ， 如 图 9-27 所 示 。 不 做 条 带 划 分 ， 只 是 严格 复 
制 ， 提 供 元 余 以 防磁 盘 驱 动 器 故障 。 

磁盘 写 要 求 写 到 两 个 磁盘 上 ， 不 过 这 可 以 并 行 ， 所 以 写 性 图 9-27 RAID 1 级: 镜像 
能 不 会 比 写 一 个 磁盘 差 很 多 。 对 于 磁盘 读 ， 控 制 器 可 以 选择 从 
具有 最 短 寻 道 时 间 和 延迟 的 磁盘 读 。 所 以 磁盘 读 的 性 能 比 只 有 一 个 磁盘 要 好 。 如 果 一 个 磁盘 
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坏 掉 了 ， 在 更 换 它 的 同时 ， 另 一 个 磁盘 可 以 继续 运行 。 当 替换 磁盘 装 好 之 后 ， 可 以 复制 好 的 
磁盘 ， 很 容易 备份 好 新 盘 。 只 有 两 个 磁盘 的 时 候 ， 通 常会 采用 镜像 ， 如 果 有 四 个 磁盘 ， 通 常 
使 用 01 级 的 条 带 化 , 这样 能 够 带 来 性 能 提升 ， 效 果 更 好 。 


9.5.3 RAID 01 和 10 级 : 条 带 化 和 镜像 


可 通过 两 种 方式 把 RAID 0 级 和 1 级 结合 起 来 ， 从 而 同时 具备 两 者 的 优势 。 第 一 种 称 
H RAID 01 级 ,或 0+1、0/1、 镜 像 的 条 带 ， 如 图 9-28a 所 示 。 采 用 镜像 的 条 带 方式 ， 只 需 
镜像 复制 0 级 条 带 化 的 磁盘 结构 。 第 二 种 是 RAID 10 级 , 或 1+0、1/0、 条 带 化 的 镜像 ， 如 
图 9-28b FIR PEHR ZH 0 级 的 磁盘 ， 而 是 让 所 有 磁盘 结对 做 镜像 ， 然 后 再 在 
这 些 镜 像 之 间 做 条 带 化 。 


Sa 
镜像 
控制 器 
aS “5 
条 带 条 带 
控制 器 控制 器 





b) RAID 10 级 : 条 带 化 的 镜像 
图 9-28 将 RAID0 级 和 1 级 组 合 起 来 
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RAID 10 级 实现 起 来 比 01 级 代价 高 一 些 。 图 9-28a 中 的 01 级 ， 每 个 条 带 控制 器 形成 一 
个 系统 ， 使 得 四 个 条 带 化 的 磁盘 对 镜像 控制 器 来 说 看 上 去 像 一 个 磁盘 。 镜 像 控 制 器 是 使 得 两 
个 镜像 磁盘 对 计算 机 来 说 看 上 去 像 一 个 磁盘 的 系统 。 而 图 9-28b 中 的 10 级 ， 每 个 镜像 控制 
器 使 得 两 个 互 为 镜像 的 磁盘 对 于 条 带 控制 器 来 说 像 一 个 磁盘 。 条 带 控制 器 使 得 四 个 条 带 化 的 
磁盘 对 于 计算 机 来 说 看 上 去 像 一 个 磁盘 。 在 这 里 例子 中 有 八 个 磁盘 ， 对 于 01 级 来 说 需要 三 
个 控制 器 ， 而 对 于 10 级 来 说 需要 五 个 控制 器 。 

10 级 相对 于 01 级 的 优势 是 可 靠 性 。 假设 有 一 块 物理 磁盘 坏 了 ， 比 如 说 第 三 块 。 
图 9-28a 中 ， 首 先 第 一 个 条 带 控制 器 会 向 镜像 控制 器 报错 ， 然 后 镜像 控制 器 会 使 用 右边 的 镜 
像 磁盘 ， 直 到 故障 盘 被 替换 。 实 际 上 在 整个 故障 期 间 ， 左 边 四 个 物理 磁盘 都 是 不 工作 的 。 在 
图 9-28b 中 ， 第 三 块 盘 损 坏 会 导致 第 二 个 镜像 控制 器 只 使 用 第 四 块 盘 (第 二 块 镜像 磁盘 )， 直 
到 故障 盘 被 替换 。 在 故障 期 间 ， 只 有 一 块 物理 磁盘 是 不 工作 的 。 

在 两 种 情况 中 ， 计 算 机 看 到 的 RAID 磁盘 的 服务 都 是 不 间断 的 ， 看 上 去 可 靠 性 好 像 是 一 
样 的 。 但 是 如 果 有 两 块 盘 同时 坏 掉 ， 问 题 就 来 了 。 图 9-28a 中 ， 如 果 一 块 坏 盘 在 左边 的 条 带 

564 磁盘 中 ， 另 一 块 在 右边 ,那么 RAID 磁盘 整个 出 现 故障 。 如 果 两 块 坏 盘 在 同一 组 条 带 磁 盘 

565) P, IKA RAID 磁盘 还 能 工作 。 图 9-28b 中 ， 只 有 同一 对 镜像 磁盘 都 坏 了 ，RAID 磁盘 才 不 
能 工作 ， 这 个 事件 发 生 的 概率 要 小 于 01 级 RAID 故障 的 概率 。 本 章 后 面 有 关于 这 个 问题 量 
化 分 析 的 练习 。 

与 01 级 相 比 , 10 级 还 有 一 个 优势 是 在 故障 盘 被 蔡 换 后 做 镜像 找 贝 的 时 间 更 短 。 图 9-28a 
中 ， 镜 像 控 制 器 把 每 个 条 带 磁盘 当 作 一 个 整体 ， 而 不 是 四 块 独立 的 磁盘 。 每 次 修复 时 ， 镜 像 
控制 只 能 把 整个 好 的 条 带 服务 器 ( 即 四 块 盘 ) 的 内 容 都 复制 到 修复 好 的 条 带 磁 盘 上 。 而 在 10 
级 中 ， 所 有 镜像 都 在 一 对 磁盘 上 完成 ， 修 复 一 块 故 障 盘 只 需要 拷贝 一 块 磁盘 的 内 容 。 

低 端 RAID 系统 通常 支持 01 级， 而 高 端 系统 既 支 持 01 又 支持 10。 采 用 这 样 的 系统 ， 
就 能 既 获得 条 带 化 的 性 能 优势 ， 又 获得 镜像 的 可 靠 性 优势 。 在 有 些 情 况 下 读 性 能 甚至 好 于 0 
级 。 考 虑 这 样 一 个 场景 ，01 级 系统 ， 读 请 求 条 带 0 ~ 5。 条 带 0 ~ 3 可 以 从 第 一 组 驱动 器 上 
并 发 读 ， 条 带 4 和 条 带 5 可 以 从 镜像 上 并 发 读 。01 级 和 10 级 都 要 求偶 数 个 硬盘 ， 最 少 需要 
四 块 。 


9.5.4 ”RAID 2 级 : 内 存 风 格 的 ECC 

镜像 的 存储 开销 是 巨大 的 ， 达 到 100%， 因 为 每 块 盘 都 被 复制 了 。 图 9-24 是 纠正 一 位 错 
误 编 码 ( single-Error-Correcting Code，ECC)， 它 的 开销 更 小 ， 通 常用 在 高 可 靠 的 存储 系统 
中 。 用 三 个 奇偶 位 纠 错 四 个 数据 位 ， 开 销 降 到 75%。 它 使 用 2 级 系统 ， 在 位 级 别 上 划分 条 
带 。 图 9-29 给 出 了 每 个 半 字 节 在 前 四 个 磁盘 上 的 分 布 。 后 三 个 磁盘 是 纠正 一 位 错误 编码 的 
奇偶 校 验 位 。 


a ee 





图 9-29 RAID 2 级 : 内 存 风格 的 ECC 
为 了 保持 性 能 ， 驱 动 器 的 旋转 必须 同步 。 完 成 一 次 磁盘 写 ， 磁 盘 控 制 器 计算 每 个 半 字 节 
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的 奇偶 校 验 位 ， 写 数据 的 同时 写 人 校 验 磁盘 。 读 的 时 候 ， 控 制 器 从 数据 计算 出 校 验 位 ， 把 它 
们 和 从 校 验 盘 中 读 出 的 位 进行 比较 ， 如 果 有 错误 就 进行 修正 。 

这 种 方案 用 在 一 些 比较 老 的 超级 计算 机 上 ， 通 常 是 32 个 数据 位 和 6 个 奇偶 校 验 位 ， 以 
保证 开销 较 小 。 今天， 便宜 的 磁盘 都 有 内 部 位 级 纠 错 能 力 ， 所 以 2 级 系统 在 商业 上 不 再 使 
用 了 。 


9.5.5 RAID 3 级 : 位 交叉 奇偶 校 验 


到 目前 为 止 ， 磁盘 阵列 中 最 常见 的 故障 是 阵列 中 有 一 块 磁盘 损坏 ， 而 磁盘 控制 器 可 以 发 
现 这 样 的 故障 ， 所 以 系统 知道 故障 在 哪里 。 如 果 在 位 级 做 条 带 化 ， 那 么 假如 知道 哪 一 位 坏 掉 
了 ， 只 用 一 个 奇偶 位 就 可 以 纠正 该 错误 。 例 如 ， 假 设 要 修复 半 字 节 1001， 使 用 偶 校 验 ， 奇 
偶 位 是 0， 那 么 存储 10010。 图 9-30 显示 1001 分 别 存在 位 0、 位 1、 位 2、 位 3， 而 奇偶 位 
0 存在 P0-3。 





图 9-30 RAID 3 级 : 位 交叉 奇偶 校 验 


假设 第 四 块 盘 坏 了 ， 所 以 知道 位 3、7、11、15 等 不 可 用 了 。 需 要 读 的 数据 是 100x0，x 
是 必须 纠正 的 位 。 因 为 使 用 的 是 偶 校 验 ， 所 以 1 的 个 数 必 须 为 偶数 ， 所 以 x 必定 为 1。 知道 
错误 发 生 在 哪里 有 助 于 将 纠正 一 位 错误 编码 的 开销 降低 到 1 个 奇偶 位 。 

虽然 3 级 系统 比 2 级 系统 提高 了 效率 ， 但 还 是 有 一 些 缺 点 。3 级 系统 的 故障 磁盘 恢复 非 
常 费时 。 使 用 镜像 ， 只 需 把 剩 下 的 好 盘 的 内 容 克 隆 到 替换 盘 ， 但 是 对 于 位 交叉 奇偶 校 验 ， 新 
替换 的 磁盘 上 的 位 必须 从 其 他 磁盘 上 的 位 计算 而 来 ， 因 此 必须 先 访问 这 些 位 。 重 建 通常 是 由 
控制 器 目 动 完成 的 。 

只 有 当 磁 盘 故 障 需要 纠 错 并 恢复 替代 盘 的 时 候 ， 才 会 使 用 奇偶 盘 。 所 以 ， 每 次 写 请 求 都 
要 更 新 奇偶 位 。 因 为 每 个 磁盘 驱动 器 在 位 级 都 有 自己 的 ECC， 所 以 每 次 读 请 求 时 不 需 访问 
奇偶 盘 〈 除 非 有 驱动 器 坏 了 )。3 级 系统 的 访问 时 间 并 不 比 单个 磁盘 的 访问 时 间 长 ， 但 是 2 级 
和 3 级 要 求 每 次 读 / 写 请 求 都 访问 每 块 数 据 盘 ， 所 以 无 法 获得 较 大 条 带 带 来 的 并 发 性 。 


9.5.6 RAID 4 级 : 块 交叉 奇偶 校 验 


3 级 和 4 级 的 唯一 区 别 是 条 带 的 大 小 。3 级 中 条 带 是 1 位 大 小 的 ， 而 4 级 中 条 带 是 一 个 
或 多 个 块 。 图 9-30 中 P0-3 代表 1 位 ， 但 在 图 9-31 中 P0-3 表示 整个 条 带 。 





图 9-31 RAID 4 级 : 块 交 叉 奇 偶 校 验 
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例如 ， 如 果 每 个 条 带 是 1KiB 大 小 ,那么 一 个 文件 在 条 带 上 的 分 布 如 下 : 

条 带 0: 位 0 一 1023 

条 带 1: 位 1024 ~ 2047 

条 带 2: 位 2048 ~ 3071 

条 带 3: 位 3072 ~ 4095 

P0-3 的 第 1 位 是 位 0、1024、2048 和 3072 的 奇偶 校 验 位 ，P0-3 的 第 2 位 是 1、1025、 
2049 和 3073 的 奇偶 校 验 位 ; 以 此 类 推 。 因 为 条 带 不 是 位 级 别 上 的 ， 与 2 级 和 3 级 不 同 ， 所 
以 磁盘 的 旋转 不 需要 同步 。 

4 级 相 比 起 3 级 来 说 ， 对 于 小 的 随机 读 请 求 更 有 优势 。 如 果 每 个 文件 的 条 带 都 分 布 在 不 
同 的 磁盘 上 ， 那 么 寻 道 、 延 迟 和 传输 都 可 以 并 行 发 生 。 在 3 级 系统 中 ， 即 使 只 是 读 一 个 小 文 
件 ， 也 要 求 所 有 数据 驱动 器 都 保持 一 致 工作 ， 多 个 小 文件 必须 顺序 地 读 。 

虽然 比 起 镜像 组 织 来 ，4 级 的 开销 已 经 大 幅 减少 ， 但 是 它 最 大 的 问题 是 写 请 求 。 如 果 要 
写 一 个 跨越 条 带 0 ~ 3 的 文件 ， 可 以 计算 P0-3 的 奇偶 位 ， 在 写 数据 的 同时 写 入 奇偶 校 验 磁 
盘 。 但 是 假设 要 写 的 文件 只 包含 在 条 带 0 内 ， 那么 要 改变 条 带 0 就 必须 改变 P0-3， 而 P0-3 
除了 是 条 带 0 的 校 验 盘 ， 同 时 也 是 条 带 1、2 和 3 的 校 验 盘 。 看 上 去 需要 读 条 带 1、2、3 和 
新 的 条 带 0 一 起 计算 新 的 校 验 位 。 不 过 有 更 有 效 的 方法 ,不 需要 读 条 带 1、2 和 3， 只 需 读 
出 旧 的 条 带 0 和 旧 的 P0-3。 对 于 新 旧 数 据 条 带 中 每 个 位 的 位 置 ， 如 果 新 的 位 不 同 于 旧 的 位 ， 
那么 就 会 把 1 的 数量 从 偶数 变 为 奇数 (或 从 奇数 变 为 偶数 )， 所 以 必须 反 转 P0-3 中 对 应 的 位 。 
如 果 新 值 和 旧 值 相同 ， 相 应 的 奇偶 位 就 可 以 保持 不 变 。 对 于 四 个 数据 磁盘 ， 这 项 技术 可 以 把 
磁盘 读 次 数 从 3 减 为 2。 

即使 采用 这 样 的 技术 ， 每 次 写 请 求 都 会 要 求 对 奇偶 盘 进 行 一 次 写 ， 不管 请 求 有 多 小 ， 因 
此 奇偶 盘 会 成 为 性 能 瓶颈 。 


95.7 RAID 5 级 : 块 交 叉 分 布 奇 偶 校 验 

5 级 系统 能 消除 奇偶 盘 成 为 瓶颈 的 现象 。 它 不 会 把 所 有 奇偶 位 都 存储 在 一 个 盘 上 ， 而 是 
把 奇偶 信息 分 散在 所 有 盘 上 ， 这 样 就 没有 一 块 盘 需 要 负责 整个 阵列 的 奇偶 信息 了 。 

图 9-32 给 出 了 一 种 常见 的 组 织 架 构 ， 称 为 左 对 称奇 偶 校 验 分 布 ， 把 奇偶 信息 分 布 到 所 
有 磁盘 上 。 它 的 优点 是 如 果 顺 序 读 一 组 条 带 ， 会 先 访问 所 有 磁盘 一 次 ， 然 后 再 访问 第 二 次 。 
图 中 假设 按照 条 带 0、1、2、3、4 的 顺序 访问 ， 会 依次 访问 第 一 、 第 二 、 第 三 、 第 四 和 第 五 
块 磁盘 。 如 果 把 条 带 4 放 到 图 中 条 带 5 的 位 置 ， 就 需要 按 顺 序 访问 第 一 、 第 二 、 第 三 和 第 一 
块 磁盘 ， 也 就 是 访问 了 第 一 块 磁盘 两 次 ， 却 一 次 都 没有 访问 第 五 块 磁盘 。 可 以 看 到 无 论 从 哪 
个 条 带 开 始 访问 ， 这 个 属性 都 是 成 立 的 。 





=> ip 
Ri 5S <a 6 
ae a ae 


图 9-32 RAIDS 级 : 块 交 叉 分 布 奇偶 校 验 
5 级 RAID 是 高 可 靠 性 、 高 性 能 、 高 容量 和 低 存 储 开销 的 理想 组 合 ， 是 目前 最 流行 的 高 
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Wig RAID 系统 。 最 流行 的 低 端 系统 可 能 是 RAID 0 级 ， 它 并 不 是 一 个 真正 意义 上 的 RAID， 
因为 没有 完 余 ， 所 以 也 没有 增强 可 靠 性 。 


本 章 小 结 


操作 系统 以 CPU 利用 率 的 方式 分 配 时 间 ， 以 主 存 和 磁盘 分 配 的 方式 分 配 存储 。 分 配 主 
存 有 五 种 技术 : 单 道 程序 设计 、 固 定 分 区 多 道 程 序 设 计 、 可 变 分 区 多 道 程 序 设 计 、 分 页 和 虚 
拟 内 存 。 采 用 单 道 程序 设计 ， 从 头 到 尾 都 只 有 一 个 作业 在 执行 ， 该 作业 占用 整个 主 存 。 固 定 
分 区 多 道 程序 设计 允许 几 个 作业 并 发 执行 ， 要 求 操作 系统 在 执行 任务 前 决定 内 存 分 区 的 大 
小 。 可 变 分 区 多 道 程序 设计 允许 根据 作业 的 要 求 调 整 分 区 的 大 小 、 减 轻 了 固定 分 区 多 道 程序 
设计 中 国有 的 低 效率 问题 。 最 优 适 配 和 最 先 适 配 是 处 理 可 变 分 区 多 道 程 序 设 计 的 碎片 问题 的 
两 种 策略 。 

分 页 通过 把 程序 分 段 装 进 内 存 的 洞 里 , 减轻 了 碎片 问题 。 程 序 不 再 连续 ， 而 是 分 段 并 分 
散在 主 存 中 。 作 业 被 划分 为 大 小 相等 的 页 ， 主 存 也 被 划分 成 同样 大 小 的 帧 。 程 序 员 看 到 的 逻 
辑 地 址 借助 于 页 表 被 翻译 为 物理 地 址 。 页 表 包 含 存储 在 主 存 中 的 每 个 页 的 帧 号 。 

按 需 分 页 也 称 为 虚拟 内 存 ， 直 到 作业 需要 某 一 页 时 才 把 它 装 载 进 内 存 。 执 行 并 不 要 求 整 
个 程序 都 装 进 主 存 ， 相 反 ， 只 有 称 为 工作 集 的 活跃 页 才 装 进 内 存 。 当 被 引用 的 页 面 不 在 内 存 
中 就 会 发 生 缺 页 。 先 进 先 出 ( FIFO) 和 最 近 最 少 被 使 用 (LRU) 是 两 种 算法 ， 用 来 决定 当 新 
页 需要 一 个 帧 来 存放 时 ， 应 将 主 存 中 的 哪 一 页 替换 出 去 。 通 常人 们 会 期 望 随 着 内 存 帧 数 的 上 
升 缺 页 数 应 该 下 降 ， 但 是 Belady 异常 表明 采用 FIFO 替换 算法 时 ， 帧 数 的 增加 可 能 会 导致 缺 
页 数量 的 增加 。 

磁盘 访问 时 间 由 三 部 分 组 成 : 寻 道 时 间 ， 这 是 机 械 臂 移 到 指定 柱 面 花费 的 时 间 ; 延迟 ， 
这 是 当 机 械 臂 到 位 后 ， 块 旋转 到 读 / 写 头 的 时 间 ; 传输 时 间 ， 这 是 块 经 过 读 / 写 头 的 时 间 。 
磁盘 管理 的 三 项 技术 是 连续 、 链 接 和 索引 。 和 主 存 一 样 ， 磁 盘存 储 也 有 碎片 的 问题 。 

可 以 往 数据 位 中 添加 一 些 元 余 位 以 检测 或 纠正 数据 传输 或 存储 中 可 能 发 生 的 错误 。 两 个 
编码 字 之 间 的 海 明 距离 是 不 同位 的 个 数 。 接 收 者 通过 选择 距离 接收 到 的 字 海 明 距离 最 近 的 编 
码 字 来 纠正 错误 。 通 过 正确 选择 元 余 位 放置 的 位 置 ， 可 以 不 用 把 接收 到 的 字 与 所 有 编码 字 都 
做 比较 就 纠正 一 位 错误 。 

廉价 磁盘 元 余 阵 列 (RAID) 是 一 组 磁盘 ， 在 操作 系统 看 来 就 好 像 是 一 个 大 的 磁盘 。 
RAID 系统 的 两 个 优势 是 性 能 和 可 靠 性 : 性 能 来 源 于 系统 中 有 多 转轴 实现 的 并 发 数据 访问 ; 
可 靠 性 来 源 于 宛 余 磁 盘 驱 动 器 实现 的 错误 纠正 和 错误 检测 。 


练习 

9.1 节 

. 采用 图 9-4 中 的 格式 ， 设计 一 个 作业 执行 序列 ， 使 得 最 先 适 配 算法 比 最 优 适 配 算法 先 需要 合并 压缩 。 
画 出 每 种 算法 在 需要 合并 之 前 主 存 的 碎片 情况 。 

2. 图 9-10 是 一 个 分 页 系统 的 页 表 ， 它 起 到 和 多 道 程序 设计 系统 中 基 址 寄存 器 一 样 的 翻译 逻辑 地 址 的 作 
用 。 图 中 没有 给 出 边界 寄存 器 对 应 的 功能 是 如 何 完成 的 。 

*(a) 要 保护 其 他 进程 的 内 存 空间 不 受 非法 访问 ,分 页 系统 是 否 需要 边界 值 表 ? 每 页 一 个 还 是 一 个 边 

界 寄 存 器 就 足够 了 ? 请 解释 。 
(b) 修改 图 9-10， 加 上 不 受 其 他 进程 非法 访问 的 内 存 保护 机 制 。 


= 





380 BLY RAH (FAA) 


3. 假设 一 个 分 页 系统 的 页 大 小 是 512 字 节 。 

(a) 如 果 大 多 数 文件 都 很 大 ， 比 512 字 节 大 很 多 ,那么 每 个 文件 的 平均 内 部 碎片 大 小 是 多 少 (以 字 
节 为 单位 的 未 使 用 空间 ) ? 解释 你 的 推理 。 

(b) 如 果 大 多 数 文件 都 远 小 于 512 F, IMA (a) 部 分 中 问题 的 答案 是 什么 ? 
(co) 如 果 以 未 使 用 空间 的 比率 而 不 是 未 使 用 字 节 数 来 表示 碎片 ,那么 (b) 问题 的 答案 又 该 是 什么 ? 

9.2 节 

[571] 4. 一 个 计算 机 具有 12 位 地 址 和 划分 为 16 个 帧 的 主 存 。 内 存 管 理 使 用 按 需 分 页 。 
*(a) 虚拟 内 存 有 多 少 字 节 ? 

(b) 每 页 中 有 多 少 字 节 ? 
(c) 逻辑 地 址 和 物理 地 址 的 偏 移 量 是 多 少 位 ? 
(d) 一 个 作业 的 页 表 中 最 多 有 和 多少 表 项 ? 

5. 对 一 个 具有 位 地 址 和 内 存 划 分 为 2* 个 帧 的 计算 机 ， 回 答 练习 4 中 的 问题 。 

*6. 图 9-12 中 哪些 页 磁盘 映像 和 内 存 中 的 页 是 完全 一 致 的 ? 

7. 图 9-15b 展示 的 是 Belady 异常 ， 针 对 书 中 给 出 的 页 引用 序列 进行 验证 。 以 图 9-13 中 的 格式 展示 帧 
的 内 容 。 

*8. 设计 一 个 12 个 页 引用 的 序列 ， 使 得 FIFO 页 替换 算法 比 LRU 算法 好 。 

9. 采用 FIFO 页 替换 算法 针对 图 9-13 的 页 引用 序列 ， 画 出 类 似 图 9-150 所 示 的 图 。 在 同一 个 图 上 ， 绘 
iil LRU 算法 的 数据 。 

*10. 如 果 操 作 系 统 能 够 预测 未 来 ， 它 会 选择 能 使 下 一 次 缺 页 尽 可 能 迟 发 生 的 页 面 来 替换 。 这 样 的 算法 称 
为 OPT， 即 最 优 页 替换 算法 。 这 是 一 个 很 有 用 的 理论 算法 ， 因 为 它 代表 你 能 做 到 的 最 好 情况 。 当 
设计 者 衡量 页 替换 算法 的 性 能 时 ， 会 试 着 尽量 接近 OPT 的 性 能 。 对 于 图 9-13 和 图 9-16 中 的 序列 ， 
OPT 会 引起 的 缺 页 次 数 是 多 少 ? 和 FIFO Al LRU 相 比如 何 ? 

9.3 节 
11. 假设 一 块 磁盘 每 分 钟 旋转 5 400 转 ， 每 个 盘面 分 为 16 个 扇 区 。 
* (a) 可 能 的 最 大 延迟 时 间 是 多 少 ? 什么 情况 下 会 发 生 ? 
(b) 可 能 的 最 小 延迟 时 间 是 多 少 ? 什么 情况 下 会 发 生 ? 
(c) 根据 (a) A (b), 平均 延迟 时 间 是 多 少 ? 
(d) 一 个 块 的 传输 时 间 是 多 少 ? 
9.4 节 
12.* (a) 存储 一 个 0 一 9 的 十 进 制 数 字 需 要 多 少数 据 位 ? 
* (b) 检测 出 一 位 错 需要 多 少 奇偶 校 验 位 ? 
(e) 写 出 一 个 使 用 偶 校 验 的 一 位 错误 检测 码 。 奇 偶 位 用 下 划 线 标 出 。 
572 (d) 你 的 编码 的 编码 距离 是 多 少 ? 
13. (a) 要 检测 出 五 位 错 ， 编 码 距 离 至 少 为 多 少 ? 
(b) 要 纠正 五 位 错 ， 编 码 距离 至 少 为 多 少 ? 
14. (a) 图 9-24 中 哪些 表 项 表示 完美 编码 ? 
(b) 补充 图 9-24 中 的 表 ， 包括 m=4 和 m=128 之 间 的 所 有 完美 编码 ， 还 要 写 出 开销 值 。 
(c) 关于 把 数据 位 数 限制 为 2 的 短 会 带 来 的 开销 ， 可 以 得 出 什么 结论 ? 
15. (a) 存储 一 个 0 ~ 9 的 十 进 制 数 字 需 要 多 少数 据 位 ? 
(b) 纠正 出 一 位 错 需 要 多 少 奇偶 校 验 位 ? 
(e) 写 出 一 个 使 用 偶 校 验 的 一 位 错误 检测 码 。 奇 偶 位 用 下 划 线 标 出 。 
(d) 你 的 编码 的 编码 距离 是 多 少 ? 
16. 传输 8 个 数据 位 的 一 组 数据 ， 使 用 图 9-25 中 的 一 位 错误 纠 错 码 。 对 于 收 到 的 下 列 每 个 位 模式 ,说 
明 是 否 发 生 错 误 。 如 果 发 生 请 纠正 。 
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*(a) 100110101001 (b) 110100110010 
(c)000010110100 (d) 101100100100 
9.5 4 


17. 图 9-28 中 的 RAID 系统 有 8 个 物理 磁盘 。 
(a) 如 果 用 6 个 物理 磁盘 ， 对 于 01 级 和 10 级 系统 ， 各 需要 多 少 个 镜像 控制 器 和 条 带 控制 器 ? 
(b) 通常 有 2n 个 磁盘 (图 9-28 中 是 n=4 )， 对 于 01 级 和 10 级 系统 ， 各 需要 多 少 个 镜像 控制 器 和 条 
带 控制 器 ? 
18.(a) 图 9-28 给 出 的 是 具有 8 个 物理 磁盘 的 RAID 01 RAM 10 级 系统 。 画 出 四 个 物理 磁盘 相应 的 01 
级 和 10 级 系统 。 
(b) 假设 坏 了 两 个 磁盘 。 序 列 BBGG 意思 是 第 一 个 和 第 二 个 磁盘 坏 了 ， 第 三 个 和 第 四 个 是 好 的 。 
在 这 种 情况 下 ，RAID 01 级 系统 是 好 的 ， 因 为 坏 的 两 个 磁盘 是 在 同一 组 条 带 化 的 磁盘 上 ， 而 
RAID 10 级 就 不 能 正常 工作 了 ， 因 为 坏 掉 的 两 个 磁盘 在 同一 组 先 做 镜像 的 磁盘 中 。 有 2 个 B 和 
2 个 G 的 四 个 字母 的 组 合 有 和 多少 种 变化 ? 
(c) 画 出 每 种 变化 并 确定 对 01 级 和 10 级 来 说 ， 此 时 RAID 系统 是 否 能 正常 工作 。 
(d) 如 果 两 个 磁盘 故障 ， 根 据 Cc) 部 分 ， 确定 01 级 和 10 级 RAID 能 够 正常 工作 的 概率 。 哪 种 
RAID 系统 更 可 靠 ? 
(e) 通常 有 2n 个 磁盘 (图 9-28 中 是 n=4)， 有 2 个 B 和 2n-2 个 G 的 2n 个 字母 有 多 少 种 组 合 ? 
(f) 在 (e) 部 分 中 ， 有 多 少 种 组 合 会 导致 01 级 或 10 级 系统 失效 ? 
(g) 如 果 有 两 个 磁盘 故障 ， 根 据 (f) 部 分 ， 确 定 01 级 和 10 级 RAID 故障 的 概率 。 
(h) 根据 (g) 部 分 ， 说 明 图 9-28 中 RAID 磁盘 失效 的 概率 ， 在 两 个 磁盘 故障 的 情况 下 ， 对 01 级 来 
说 是 4/7, 10 级 是 1/7。 
19. 有 一 个 RAID 4 级 系统 、 八 个 数据 盘 和 一 个 奇偶 盘 。 
(a) 如 果 不 使 用 旧 数 据 和 旧 奇 偶 值 ， 写 一 个 数据 条 带 需 要 多 少 磁盘 读 和 磁盘 写 ? 
(b) 如 果 使 用 旧 数 据 和 旧 奇 偶 值 ， 写 一 个 数据 条 带 需要 多 少 磁 盘 读 和 磁盘 写 ? 
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我 们 终于 要 讲 到 典型 计算 机 系统 的 最 底层 了 。 每 个 抽象 层 都 隐藏 了 上 一 层 用 户 不 需要 的 
细节 ，LG1 层 的 细节 对 ISA3 层 ， 即 指令 集 架 构 层 的 用 户 来 说 是 隐藏 的 。 要 记 住 ISA3 层 用 
户 看 到 的 是 使 用 机 器 语言 的 冯 ' 诺 依 曼 机 器 ，LG1 层 设计 者 的 工作 是 构建 ISA3 层 机 器 。 最 
后 三 章 讲述 LG1 层 语 言 和 设计 原理 ,这些 内 容 对 于 构建 汉 ， 诺 依 曼 机 器 是 必需 的 。 

本 书 中 的 图 都 会 有 指令 集 架构 层 稳 辑 门 层 之 间 的 微 代码 层 。 一 些 设计 者 在 机 器 中 选择 
省 略微 代码 层 而 直接 从 LGI 层 构建 ISA3 层 机 器 ， 还 有 一 些 设 计 者 则 选择 使 用 微 代码 层 。 

这 两 种 设计 方法 的 优点 和 缺点 是 什么 呢 ? 答案 和 我 们 在 第 7、 第 6 和 第 5 层 遇 到 的 一 
样 。 假 定 需要 给 App7 层 的 用 户 设计 一 个 应 用 程序 ， 你 是 愿意 用 HOL6 层 的 C 来 编写 ， 然 后 
把 它 编译 到 较 低 的 层 上 ， 还 是 愿意 直接 用 Asmb5 层 的 Pep/9 汇编 语言 来 编写 呢 ? 因为 C 在 
较 高 的 抽象 层级 ， 一 条 C 语句 能 做 多 条 Pep/9 语句 的 工作 ， 所 以 C 程序 要 比 等 效 的 Pep/9 程 
序 短 很 多 ， 因 此 也 更 容易 设计 和 调试 。 但 是 需要 用 编译 器 把 C 程序 翻译 到 较 低 的 层级 ， 而 
且 优秀 的 汇编 语言 程序 员 通 常 能 生成 甚至 比 优化 编译 器 产生 的 目标 代码 还 要 简短 和 快速 的 代 
码 。 汇 编程 序 可 以 执行 得 更 快 ， 但 是 很 难 设计 和 调试 ， 因 此 开发 成 本 高 昂 。 

在 第 7 层 、 第 6 层 和 第 $ 层 要 权衡 的 是 开发 成 本 和 执行 速度 , 在 第 3 层 、 第 2 层 和 第 1 
层 也 是 一 样 。 通 常 ， 包 括 Mc2 层 的 系统 要 比 省 略 它 的 系统 简单 并 且 成 本 更 低 ， 但 是 它们 通 
常 比 直 接 从 LG] 层 构 建 的 系统 执行 得 更 慢 。 最 近 的 设计 趋势 
是 用 小 指令 集 构建 简单 但 快速 的 汉 : 诺 依 曼 机 器 ， 称 为 精简 
指令 集 计 算 机 (Reduced Instruction Set Computer, RISC). 
RISC 机 器 的 一 个 重要 特性 就 是 它 省 略 了 Mc2 层 。 

逻辑 门 层 下 有 两 个 层级 是 很 有 趣 的 ， 如 图 10-1 所 示 ， 
但 在 本 书 中 不 做 描述 。 在 电子 设备 层 (第 0 层 ),， 设计 者 连 
接 唱 体 管 、 电 阻 和 电容 形成 LG1 层 的 逻辑 门 。 在 物理 层 
(第 -1 层 )， 应 用 物理 学 家 构建 电子 工程 师 构 成 门 电路 所 需 
的 晶体 管 ， 而 计算 机 架构 师 用 门 来 构建 汉 : 诺 依 曼 机 器 。 物 
理 层 下 没有 别 的 层次 ， 它 是 所 有 科学 的 基础 。 

第 0 和 第 -1 层 的 语言 是 一 组 数学 公式 ， 对 本 层 的 对 象 。 图 10-1 逻辑 门 层 以 下 的 层次 
行为 建 模 。 你 也 许 熟 悉 其 中 的 一 些 。 第 0 层 包 括 欧 姆 定律 
(Ohm’s law)、 基 尔 霍 夫 定 律 〈(Kirchoff's rule) 以 及 电子 设备 的 电压 电流 特性 。 第 -1 层 包 括 
库仑 定律 (Coulomb's law)、 牛 顿 定律 (Newton’s law) 和 一 些 量子 力学 定律 。 在 所 有 层次 上 ， 
从 App7 层 的 关系 数据 库 计 算 到 -1 层 的 牛顿 定律 ， 形 式 化 数学 都 是 对 系统 行为 建 模 的 工具 。 


10.1 布尔 代数 和 逻辑 门 
电路 (circuit) 是 物理 上 由 线路 连接 起 来 的 设备 集合 。LG1 层 电 路 有 两 种 基本 类 型 :组 
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合 电路 和 时 序 电 路 。 可 以 把 任 一 种 电路 类 型 表示 成 一 个 叫 作 黑金 (black box) 的 长 方块 ， 有 
固定 数量 的 输入 线 和 输出 线 。 图 10-2 展示 了 一 个 三 输入 二 输出 的 电路 。 

每 条 线路 携带 一 个 信号 ， 其 值 可 以 为 1 或 0。 在 电子 学 
上 ， 信 号 1 是 一 个 小 电压 ， 通 常 大 约 是 3V， 信 号 0 是 0V。 


电路 被 设计 成 只 能 检测 和 产生 这 样 丙 种 二 元 值 。 i a 

可 以 把 图 10-2 看 成 一 种 说 明 输入 - 处理- 输出 结构 的 方 一 到 
式 ， 在 计算 机 系统 的 所 有 层级 都 能 看 到 。 电 路 执行 处 理 ， 把 | 
输入 转换 为 输出 。 图 10-2 ”表示 一 个 电路 的 黑 盒 


10.1.1 组 合 电路 


对 于 组 合 电路 (combinational circuit)， 输 入 决定 输出 。 例 如 在 图 10-2 中 ， 如 果 今 天 输 
入 是 a=1, b=0, c=1 (缩写 为 abc=101 )， 得 到 输出 xy=01 ; 明天 输入 是 abc=101， 还 是 得 到 
输出 xy=01。 在 数学 上 , x 和 y 是 a、b 和 c 的 函数 ， 即 x=x(a, b,c) 和 y=y(a, b,c)。 

时 序 电 路 则 不 然 。 如 果 对 时 序 电 路 输入 abc=101， 可 能 有 时 会 得 到 xy=01, 但 是 几 微 秒 
后 得 到 xy=11。 第 11 章 会 解释 这 种 看 上 去 没有 什么 意义 的 行为 是 怎样 发 生 的 ， 以 及 对 于 构 
建 计 算 机 而 言 这 种 行为 为 什么 是 不 可 或 缺 的 。 

描述 组 合 电路 行为 的 三 种 最 通用 的 方法 是 : 

e 真 值 表 ; 

o 布尔 代数 表达 式 ; 

e PHR, 

本 节 剩 余部 分 将 描述 这 些 表示 方法 。 


10.1.2” 真 值 表 


表示 组 合 电路 的 三 种 方法 中 ， 真 值 表 要 比 代 数 表 达 式 和 逻辑 图 的 抽象 层次 更 高 。 真 值 表 
说 明 组 合 电 路 做 什么 ， 而 不 是 说 明 怎 样 做 。 真 值 表 只 是 列 出 输入 值 每 种 可 能 组 合 的 输出 (这 
就 是 组 合 电路 名 称 的 由 来 ) 。 

图 10-3 是 一 个 三 输入 二 输出 组 合 电路 的 真 值 表 。 因 为 有 3 个 输入 ， 每 个 输入 
有 两 种 可 能 的 值 ， 因 此 这 个 表 有 2:=8 个 条 目 。 通 常情 况 下 , n 输入 组 合 电 路 的 真 值 表 有 2” 
个 条 目 。 m 


o o o ona 





图 10-3 三 输入 二 输出 组 合 电路 的 真 值 表 


10-4 是 为 一 个 由 真 值 表 说 明 组 合 电 路 的 例子 ， 它 是 一 个 四 输入 的 电路 ， 其 
真 值 表 中 有 16 个 条 目 。 m 

图 10-2 的 黑 盒 图 尤其 适合 组 合 电路 的 真 值 表 表示 。 人 们 看 不 到 涂 黑 的 盒子 里 面 是 什么 
样 的 ， 同 样 也 看 不 到 电路 怎样 生成 真 值 表 定义 的 函数 。 
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图 10-4 四 输入 二 输出 组 合 电路 的 真 值 表 


10.1.3 布尔 代数 


根据 布尔 代数 定律 写 出 的 代数 表达 式 不 仅 说 明 组 合 电 路 做 什么 ， 而 且说 明 它 是 怎样 做 
dace eli te td the 
代数 的 四 个 基本 运算 是 加 、 减 、 乘 、 除 ,布尔 代数 的 三 个 基本 运算 是 OR (符号 为 “+” 
AND (符号 为 “.") 和 “ 求 补 ”( 符 号 为 “'"”)。AND 和 OR 是 二 元 运算 , 求 补 是 一 元 
运算 。 

布尔 代数 的 10 个 基本 属性 是 


xty=y+x xX" yy "x 交换 律 
(x + y) + z=x + y +z) (x+y) + z=x * ("2) 结合 律 
x+ (° z)=x +y) * (x +2) x* +z) >+ y)+ (x-z) 分 配 律 
x+0=x x + i= 恒 等 律 
x +(x')=1 x + (x')=0 互补 律 


其 中 , zx. 了 和 = 是 布尔 变量 。 和 实数 代数 一 样 ， 表 达 式 中 插入 圆 括号 表示 哪些 运算 要 先 执 行 。 
为 了 简化 ， 避 免 表 达 式 中 出 现 过 多 括号 ， 布 尔 运算 有 如 图 10-5 所 示 的 优先 级 结构 。 使 用 这 
种 优先 级 规则 ， 分 配 律 变 成 

x+y a+ y) (+z) P ea a pte Zz 
互补 律 变 成 

x+x=l x. x=0 

实数 代数 和 布尔 代数 属性 之 间 的 一 个 显著 不 同 是 分 

配 律 。 对 于 实数 ， 乘 法 在 加 法 上 有 分 配 律 ， 例 如 
2.(3+4)=2.3+2 .4 图 10-5 布尔 运算 符 的 优先 级 规则 
但 是 加 法 在 乘法 上 没有 分 配 律 ， 例 如 
2+3- 4=—(2+3):(2+4) 

是 不 成 立 的 。 然 而 在 布尔 代数 中 ,“+” 代 表 OR,“' ”代表 AND，OR 在 AND 上 没有 分 
配 律 。 

布尔 代数 的 定律 有 实数 代数 没有 的 对 称 性 ， 每 个 布尔 属性 都 有 对 偶 性 (dual property). 
做 如 下 操作 : 

e 交换 “+” 和 “， 

e 交换 1 和 0 
就 能 得 到 对 偶 的 表达 式 。 分 配 律 的 两 种 形式 就 是 对 偶 表 达 式 的 一 个 例子 。 在 分 配 律 

x+(y* z(t y) > x +2Z) 

中 ， 如 果 交 换 “+” 和 “' ”运算 符 ， 就 会 得 到 
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X QHZ y) + > z) 
这 是 另 一 个 分 配 律 表达 式 。 布 尔 代数 的 每 个 基本 属性 都 有 相应 的 对 偶 性 。 
结合 律 也 使 得 表达 式 可 以 进一步 简化 。 因 为 执行 两 个 OR 运算 的 顺序 是 不 重要 的 ， 你 可 以 把 
(x+y)+z 
写成 没有 括号 的 
Kt YZ 


这 也 适用 于 AND 运算 。 
10.1.4 布尔 代数 定理 


因为 布尔 代数 和 我 们 熟悉 的 实数 代数 有 不 同 的 数学 结构 ， 所 以 布尔 代数 的 定理 初 看 之 下 
可 能 显得 很 特殊 。 接 下 来 要 讨论 从 布尔 代数 的 10 个 基本 属性 证 明 出 来 的 定理 ， 它 们 在 组 合 
电路 的 分 析 和 设计 中 非常 有 用 。 

% 4 (idempotent property) 表明 

x+x=x 
证 明 这 个 定理 需要 一 系列 的 替换 步骤 ， 每 一 步 都 基于 布尔 代数 的 10 个 基本 属性 之 一 : 
范 志 区 
= < 恒 等 律 > 
| 
= < 互补 律 > 
(x+x) ar) 
= ”< 分 配 律 > 
¥+(x > x’) 
= < 互补 律 > 
¥+0 
= < 恒 等 律 > 
% 
对 偶 性 为 
X * XX 
对 偶 定 理 的 证 明和 上 述 步 又 完全 一 样 ， 每 个 替换 都 基于 原 证 明 中 对 应 步骤 的 对 偶 属性 : 
PRN 
= < 人 恒 等 律 > 
(xx) +0 
= < 互补 律 > 
(x * x) +(x* x’) 
= < 分 配 律 > 
x s(t) 
= < 互补 律 > 
#71 


= < 恒 等 律 > 
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Fe SER AEA Res T a RP EN — A, EA TSE, BA 
就 可 以 立即 断言 它 的 对 偶 定律 也 一 定 成 立 。 因 为 10 个 基本 属性 中 的 每 一 个 都 有 对 偶 属 性 ， 
所 以 对 应 的 证 明 在 结构 上 和 原 证 明 是 相同 的 ， 只 不 过 每 一 步 都 基于 原始 步骤 的 对 偶 属性 。 

这 里 有 三 个 更 有 用 的 定理 及 它们 的 对 偶 定 理 。 证 明定 理 的 数学 规则 是 可 以 在 证 明 中 使 用 
任何 公理 或 以 前 已 经 证 明了 的 定理 。 要 证 明 下 面 第 一 个 定理 ， 可 以 使 用 任何 基本 属性 和 震 
等 性 。 要 证 明 第 二 个 定理 ， 可 以 使 用 任何 基本 属性 、 客 等 性 和 已 经 证 明了 的 第 一 个 定理 ， 等 
等 。 第 一 个 定理 


x+ 1=1 x + 0=0 
称 作 零 元 定理 。0 是 AND 运算 符 的 零 元 ，1 是 OR 运算 符 的 零 元 。 第 二 个 定理 
LK! PRX x + (x+ y)=x 


称 作 吸收 律 ， 因 为 y 被 吸收 到 x 中。 第 三 条 定理 
Xp+X "2+y sexe yt! sz 
(x+y) * @'+z)* w+ +y) +z) 
称 作 合意 (consensus) 定理 。 这 几 个 定理 的 证 明 作为 章 末 练 习 。 


10.1.5 互补 证 明 


x 的 补 是 x'。 要 证 明 表达 式 y 是 表达 式 z 的 补 ， 必 须 证 明 y 和 z 遵 循 同样 的 互补 属性 ， 
就 像 x 和 x' 一 样 ， 即 
y+z=l 7 2=0 
互补 证 明 的 一 个 例子 是 德 .摩根 定律 (De Morgan’s law)， 它 表明 
(a+ b)'=ab' 
要 证 明 a b 的 补 是 a'+ 六， 必须 证 明 
(a+ b)+ (a+ b')=1 (a + b) + (a'+ b')=0 
这 个 证 明 的 第 一 部 分 如 下 
(a+ b)+ (a b’) 
= < 交换 律 > 
(a'+ b') + (a > b) 
= < 分 配 律 > 
[(a'+ b') + a] + [(a+ b') + b] 
= < 交换 律 和 结合 律 > 
[b'+ (a+a’)] - [a'+ (b + b')] 
= ”< 互补 律 > 
[b'+ 1] * [a'+ 1] 
= ”< 零 元 定理 , x+1=1> 
a | 
= <feS#, (x° =D := 1] 
1 
证 明 的 第 二 部 分 如 下 
(a+b): (+D) 
= ”< 分 配 律 > 


BIO AEB 389 


(a: b)+a'+(a+b)+b' 
= < 交换 律 和 结合 律 > 
D…(a' al)+a' (b-b 
= ”< 互补 律 > 
b-0+a:0 
= <7 #, x-0=0> 
0+0 
= <E, (x+0=x)[x :=0]> 
0 
德 ， 摩根 第 二 定律 
(a+b)=a’': b' 
直接 从 对 偶 性 得 出 。 
德 . 摩根 定律 可 推广 到 多 个 变量 的 情况 。 对 于 3 个 变量 ， 该 定律 是 
(a+ b+c)=a'+b+e' (at+b+c)=a': b'» c' 
多 于 两 个 变量 的 一 般 性 定理 的 证 明 作为 章 末 练习 。 
男 一 个 互补 定理 是 (x)= x, x' 的 补 是 x， 因 为 x 咎 x=1， 其 证 明 如 下 
Xx 
= < 交换 律 > 
x+x' 
< 互补 律 > 
1 


以 及 x'* x=0， 其 证 明 如 下 
X% 

= < 交换 律 > 
xex 
< 互补 律 > 
0 
还 有 一 个 互补 定理 是 1= 0，1 是 0 的 补 ， 因 为 1 + 0=1， 其 证 明 如 下 
1+0 
< 恒 等 律 ，(x 十 0=x) [x :=1]> 
1 


ll 


以 及 1* 0=0， 其 证 明 如 下 
1-0 
= < 交换 律 > 
0-1 
< EF, (x° 1=x) [x :=0]> 
0 


可 以 直接 得 出 对 偶 定理 0= 1。 


10.1.6 ”逻辑 图 
组 合 电 路 的 第 三 种 表示 方法 是 逻辑 门 的 互联 。 因 为 逻辑 图 中 连接 门 的 线路 表示 连接 电路 


390 BRED BH (F1A) 


板 或 集成 电路 上 物理 设备 的 物理 线路 ， 所 以 这 种 表现 形式 最 接近 于 硬件 。 
每 个 布尔 运算 由 一 个 门 符号 来 表示 ， 如 图 10-6 所 示 。AND 和 OR 门 有 两 条 输入 线 ， 标 
识 为 a 和 4b; 反 相 器 只 有 一 条 输入 线 ， 输 出 是 x， 这 对 应 于 求 补 是 一 元 运算 的 事实 。 图 中 也 


展示 出 了 每 个 门 对 应 的 布尔 表达 式 和 真 值 表 。 





0 
1 
1 
1 


b) OR 门 
图 10-6 三 类 基本 的 逻辑 门 








c) 反 相 器 


任何 布尔 函数 都 能 只 用 AND 、OR 和 求 补 运算 写 出 来 ， 并 由 此 构建 任何 组 合 电路 ， 
图 10-6 中 的 三 个 基本 门 。 实 际 中 还 有 几 个 其 他 常用 的 门 ， 图 10-7 给 出 了 其 中 的 三 个 。 


tO oe o 











X= (2 by =(a+b)' x=a®b 
1 0 oO] 1 o 
1 0 i9 0 
1 1 0} 0 1 
0 Ly 10 1 
a) NAND 门 b) NOR 门 c) XOR 门 


图 10-7 三 类 常见 的 逮 辑 门 


NAND (Not AND， 与 非 ) 门 等 价 于 AND 门 后 跟 一 
反 相 器 ， 如 图 10-8 所 示 。 类 似 地 ，NOR (Not OR， 与 或 ) 
门 等 价 于 OR 门 后 跟 一 个 反 相 器 。 在 电子 学 上 ,构建 NAND 
门 往往 比 构建 AND 门 容易 。 实 际 上 经 常用 NAND 门 后 跟 
反 相 器 来 构建 AND 门 。NOR 门 也 要 比 OR 门 更 常用 。 

XOR (exclusive OR) 表示 异 或 ， 而 OR 有 时 称 为 包含 
X (inclusive OR)。 如 果 任 一 输入 或 者 两 个 输入 都 为 1， 那 
A OR 门 的 输出 为 1。 如 果 只 有 一 个 输入 为 1， 那么 XOR 门 
的 输出 为 1 ; 如果 两 个 输入 都 是 1， 那么 XOR 门 输 出 为 0。 
XOR 运算 的 代数 符号 是 信 ，a 申 必 的 代数 定义 是 

a@Bb=a'b'+a'.b 

XOR 运算 符 的 优先 级 高 于 OR 但 是 低 于 AND， 如 

图 10-9 所 示 。 


b) NAND 
图 10-8 两 个 等 价 的 组 合 电路 





最 低 OR 
图 10-9 XOR 运算 符 的 优先 级 
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表达 式 
a+b®c'd 


完全 加 上 括号 得 到 a+ (bOl(c-d)). 根据 XOR 的 定义 展开 后 ， 表 达 式 变 为 
a+b:(c:d)'+b':(c: 4d) a 
也 可 以 使 AND 和 OR 有 2 个 以 上 的 输入 。 图 10-10 展示 
了 一 个 三 输入 AND 门 和 它 的 真 值 表 。 只 有 当 所 有 输入 均 为 1 
时 ，AND 门 的 输出 才 为 1。 只 有 当 所 有 输入 均 为 0 时 ，OR 门 
的 输出 才 是 0。 


10.1.7 ”其 他 表示 方式 


你 可 能 已 经 看 出 AND 门 、OR 门 和 反 相 器 的 真 值 表 与 C 
布尔 表达 中 AND, OR 和 NOT 运算 的 真 值 表 具有 相似 性 。 它 
们 的 真 值 表 是 一 样 的 ，NOT 对 应 反 相 器 ，C 的 真 值 和 假 值 分 
别 对 应 布尔 代数 的 1 和 0。 

布尔 代数 的 数学 结构 非常 重要 ， 因 为 它 不 仅 适用 于 组 合 电 
路 ,而且 也 适用 于 语句 逻辑 。C 用 语句 逻辑 来 确定 包含 在 让 和 
循环 语句 中 的 条 件 的 真 假 。 人 工 智 能 中 一 组 很 重要 的 编程 语言 
甚至 更 加 广泛 地 使 用 了 语句 逻辑 ， 用 这 些 语言 编写 的 程序 通过 
一 种 称 为 逻辑 编程 ( logic programming) 的 技术 来 模拟 人 的 推 
理 。 布 尔 代数 是 这 个 领域 的 主要 组 成 部 分 。 图 10-10 三 输入 的 AND 门 

布尔 代数 的 另 一 种 表示 方式 是 使 用 集合 运算 。 如 果 把 一 个 
布尔 变量 看 作 一 个 集合 ，OR 运算 看 作 集 合 的 并 ，AND 运算 看 作 集合 的 交 ， 求 补 运算 看 作 集 
合 的 补 ，0 看 作 空 集 ，1 看 作 人 全集， 那么 所 有 布尔 代数 的 性 质 和 定理 也 适用 于 集合 。 

定理 





0 
0 
0 
0 
1 
1 
1 
1 
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x+ i=l 


说 明 全 集 和 任何 其 他 集合 的 并 集 是 全 集 。 m 


10-11 展示 的 是 用 集合 论 的 文 氏 图 (Venn diagram) 来 解释 吸收 律 
天 十 大。JFX 
图 10-11a 给 出 的 是 集合 x， 图 10-11b 是 x 和 y 的 交集 ， 也 就 是 既 在 x 又 在 y 中 的 所 有 元 
素 的 集合 。 这 个 集合 和 x 的 并 集 如 图 10-11c 所 示 。 可 以 看 到 图 10-11a 中 的 区 域 和 图 10-11c 


中 的 区 域 是 相同 的 ， 这 说 明了 吸收 律 。 m 





b)x-y 
图 10-11 吸收 律 的 集合 论 解释 


以 布尔 代数 来 解释 组 合 电 路 的 描述 ， 以 及 它 作 为 语句 逻辑 的 基础 ， 表 明 它 是 计算 机 科学 中 
大 部 分 理论 和 应 用 的 数学 基础 。 它 还 能 描述 集合 论 ， 也 表明 了 它 在 其 他 数学 领域 里 的 重要 性 。 
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10.2 组合 分 析 


每 个 布尔 表达 式 有 一 个 对 应 的 逻辑 图 ， 每 个 逻辑 图 有 一 个 对 应 的 布尔 表达 式 。 用 数学 
术语 来 说 ， 两 者 之 间 是 一 一 对 应 的 关系 。 然 而 ， 给 定 一 个 真 值 表 会 有 几 种 不 同 的 实现 方式 。 


图 10-12 展示 了 一 个 真 值 表 ， 有 几 个 对 应 的 布尔 表达 式 和 逻辑 图 。 
一 
图 10-12 ”一 个 给 定 的 真 值 表 可 以 有 多 种 实现 
本 节 讲 述 组 合 电路 三 种 表示 方式 之 间 的 对 应 关系 。 


10.2.1 布尔 表达 式 和 逻辑 图 

布尔 表达 式 由 用 AND, OR 和 反 相 运算 组 合 在 一 起 的 一 个 或 多 个 变量 组 成 。 电 路 输入 的 
数量 等 于 变量 的 数量 。 本 节 和 下 节 都 专注 于 单 输出 电路 ， 本 章 最 后 一 节 会 涉及 多 于 一 个 输出 
的 电路 。 

画 出 给 定 布 尔 表达 式 的 逻辑 图 ， 就 是 给 每 个 AND 运算 画 AND 门 ， 给 每 个 OR 运算 画 
OR 门 ， 给 每 个 求 补 运 算 画 反 相 器 。 根 据 表达 式 将 一 个 门 的 输出 连接 到 男 一 个 门 的 输入 。 该 
组 合 电路 的 输出 是 某 一 个 门 的 输出 ， 这 个 门 的 输出 没有 连接 到 另 一 个 门 的 输入 。 

图 10-13 展示 了 对 应 布尔 表达 式 a + b+ e 的 逻辑 图 。 


a 

























布尔 表达 式 布尔 表达 式 布尔 表达 式 


b' a+ bc 
b b'c 


C 


图 10-13 布尔 表达 式 at pc 的 逻辑 图 
从 现在 开始 ， 我 们 将 忽略 AND 运算 的 符号 ， 把 这 个 布尔 表达 式 写 成 


a+t+b'c 
在 每 个 门 的 输出 上 标 出 它 对 应 的 表达 式 。 a 
当 表 达 式 有 括号 时 ， 必 须 首先 构建 括号 内 的 子 图 。 
图 10-14 是 三 变量 表达 式 
((aQp+pc a)’ 






((ab + bc’ Jay 


图 10-14 布尔 表达 式 ((ab+be'Jay' HE HA 


的 逻辑 图 ， 首 先 用 一 个 AND 门 形 成 abp， 用 男 一 个 AND 门 形成 be'"， 这 两 个 门 的 输出 进行 
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OR 运算 ,然后 和 a 进行 AND 运算 。 因 为 要 对 整个 表达 式 求 补 ， 因 此 反 相 器 是 最 后 的 门 。 四 

图 10-14 中 的 两 个 小 黑 点 是 结合 点 ， 在 结合 点 处 两 条 线路 物理 上 是 相连 接 的 。 回 想 一 
下 ， 变 量 a 提供 的 物理 信号 是 电压 ， 当 输入 a 来 的 信号 到 达 结 合 点 时 ， 它 不 像 河 里 的 水 在 河 
道里 遇 到 分 又 那样 ， 一 些 水 分 又 流 到 一 条 路 径 上 ， 另 一 些 水 分 又 流 到 另 一 条 路 径 上 。 在 逻辑 
图 中 ,不 存在 一 部 分 信号 去 一 个 AND 门 的 输入 ， 另 一 部 分 信号 去 男 一 个 AND 门 的 输入 这 
种 情况 ， 从 a 来 的 信号 完全 复制 到 两 个 门 的 输入 上 。 

对 于 具有 一 定 物理 知识 的 人 来 说 ， 产 生 这 种 现象 的 原因 是 电压 是 电势 的 度量 。 导 线 的 电 
阻 很 低 ， 根 据 欧 姆 定律 ， 这 意味 着 在 导线 上 的 电势 改变 可 以 忽略 不 计 ， 所 以 沿 着 任何 物理 上 
连接 的 线路 ， 电 压 是 恒定 不 变 的 。 因 此 不 管 有 没有 结合 点 ， 电 压 信 号 在 任何 点 都 是 一 样 的 。 
(对 不 懂 物 理 知识 的 人 来 说 ， 这 可 能 是 一 个 学 习 的 动机 ! ) 

任何 来 自 变量 的 信号 都 能 利用 结合 点 进行 复制 。 任 何 变 量 的 补 都 能 用 反 相 器 生成 ， 变 量 
的 补 同样 也 能 通过 结合 点 复制 。 在 逻辑 图 中 经 常 忽略 ， 即 不 显示 变量 复制 的 结合 点 和 变量 反 
相 器 。 也 就 是 可 以 假设 任何 变量 和 它 的 补 都 可 以 作为 任何 门 的 输入 。 

图 10-15 是 图 10-14 利用 这 个 假设 后 的 简略 版 ， 它 也 认可 AND 门 后面 跟 反 相 
器 等 同 于 NAND 门 。 m 


图 10-15 图 10-14 的 简略 版 


这 个 简略 图 的 缺点 是 ， 此 网 络 实际 上 有 三 输入 这 种 情形 ， 但 没有 图 10-14 中 表现 得 
明显 。 
图 10-16 展示 的 是 四 输入 布尔 表达 式 
(a'bc®c+a+d)' 
的 逻辑 图 。 要 注意 异 或 运算 符 的 优先 级 低 于 AND ， 但 是 高 于 OR。 
A d 


图 10-16 布尔 表达 式 (a'bc ®c+a+d) ' 的 逻辑 图 


要 根据 给 定 的 逻辑 图 写 出 布尔 表达 式 ， 就 是 简单 地 把 每 个 门 的 输出 用 适当 的 子 表 达 式 标 
识 出 来 。 如 果 没 有 给 布尔 表达 式 而 是 给 了 图 10-16 的 逻辑 图 ,那么 应 该 从 用 a'be 标识 AND 
门 的 输出 做 起 。XOR 门 的 输出 应 该 标识 为 a'bc 四 c， 它 通过 NOR 门生 成 完整 的 布尔 表达 式 。 


10.2.2 ” 真 值 表 和 布尔 表达 式 
根据 真 值 表 生 成 布尔 表达 式 的 一 种 方法 是 把 没有 括号 的 表达 式 写成 几 个 AND 项 的 OR, 
每 个 AND 项 对 应 真 值 表 中 的 一 个 1。 
a b 的 真 值 表 有 两 个 1， 对 应 的 布尔 表达 式 是 
a ® b=a'b + ab’ 
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WRaA0, bA1, 那么 第 一 个 AND 项 将 会 是 1 ; 如 果 a 为 1、4b 为 0， 那么 第 二 个 AND 
项 将 会 是 1。 不论 哪 种 情况 ， 这 两 项 的 OR 将 会 是 1。 此 外 ,任何 其 他 a 值 和 4。 值 的 组 合 将 
使 这 两 个 AND 项 都 为 0， 所 以 布尔 表达 式 为 0。 u 

GEED 图 10-3 E7 abc=001 和 abc=011 时 , x 为 1; abe 为 其 他 组 合 时 ，x 为 0。 
对 应 的 布尔 表达 式 为 

x=a'b'c + a'bc 

当 且 仅 当 abc=001 时 ， 第 一 个 AND 项 a'b'c J1, 4 BAL% abc=011 时 ， 第 二 个 AND 项 为 
1， 除 了 这 两 个 条 件 以 外 ， 这 两 项 的 OR 都 将 为 0， 和 真 值 表 一 样 。 

图 10-4 中 x 的 真 值 表 是 四 个 变量 的 例子 ， 对 应 的 表达 式 为 

x=a'be'd + a'bed + abc'd + abcd 

有 4 种 a、b、c 和 4 的 组 合 会 得 出 真 值 表 里 的 1。 m 

对 偶 技 术 能 够 把 表达 式 写成 几 个 OR 项 的 AND, 4+ OR 项 对 应 真 值 表 中 的 0。 

图 10-17 的 表达 式 是 


x=(a+b'+ c'\(a't b'+ c) 


poet Mem A 
0 0 0 1 
0 0 ] 1 
0 1 0 1 
0 1 1 0 
1 0 0 1 
1 0 1 1 
1 1 0 0 
1 1 1 1 


图 10-17 三 变量 的 真 值 表 


如 果 abc=011， 那 么 第 一 个 OR 项 为 0 ; 如 果 abc=110， 那 么 第 二 个 OR 项 为 0。 满 足 这 两 个 
条 件 中 的 任意 一 个 ，OR 项 的 AND RH 0. abe 的 所 有 其 他 组 合 会 使 两 个 OR 项 为 1， 表达 
式 的 值 为 1。 m 
给 定 一 个 布尔 表达 式 ， 构 建 对 应 真 值 表 最 直接 的 方式 是 ， 计 算出 变量 所 有 可 能 组 合 的 表 
达 式 的 值 。 
CEB 构建 


的 真 值 表 需 要 计算 


x (a, b)=(a Ð b)'+ a’ 


x (0, 0)=(0 ® 0)'+ 0 1 
x (0, 1)=(0@ 1)'+ 051 
x (1, 0=0 © 0)'+ 1=0 
x(1, I= ®1)+1=1 
这 个 例子 需要 计算 两 个 变量 a Al b 的 四 种 可 能 组 合 的 值 。 a 
如 果 表 达 式 包含 多 于 两 个 变量 ， 有 时 候 利用 布尔 代数 的 属性 和 定理 把 布尔 表达 式 转换 成 6 


几 个 AND 项 的 OR 要 更 容易 些 ， 由 此 可 以 写 出 真 值 表 。 
10-16 的 表达 式 简 化 为 
(abc 由 c+a+d)' 
= < 由 的 定义 > 
(a‘bec'+ (a'be)'c +a+d)' 
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= (EME, cc'=0; 零 元 定理 ,x :0=0》 


((a'be)'c +a+d)' 
= (fh + 摩根 定律 》 


((a+ b'+c')e+at+d)' 


= 《分 配 律 、 互 补 律 和 恒 等 律 》 


(ac+ b'c+a+d)!' 
= (RKB, atac=a) 
(a+b'c+d)' 
《 德 . 摩根 定律 》 
a'(b'c)'d' 
《 德 ， 摩 根 定律 》 
a'(b + c')d' 
(ARE) 
a‘bd'+a'c'd' 
HEKA 16M. MAAR, E abd=010 (两 项 ) 
和 acd=000 (两 项 ) 的 地 方 插入 1， 所 有 其 他 项 是 0， 结 
果 如 图 10-18 所 示 。 由 于 apd=010 的 其 中 一 项 也 满足 
acd=000， 因 此 有 3 个 1 而 不 是 4 个 。 
这 项 技术 避免 了 计算 原始 表达 式 16 次 。 实 际 上 这 
个 任务 可 能 没有 刚 开 始 看 上 去 那么 困难 。 只 要 稍微 想 一 
下 ， 就 能 根据 4 为 1 时 的 原始 表达 式 推 论 出 不 管 w、p 
和 的 值 是 什么 ， 括 号 内 的 表达 式 一 定 是 1， 它 的 反 一 
定 是 0。 类 似 情 况 ， 当 a 为 1 时 表达 式 一 定 为 0。 这 样 
HRP F ad=00 的 四 种 情况 了 。 


10.2.3 ”两 级 电路 


每 个 布尔 表达 式 都 可 以 转换 成 AND-OR 表达 式 ， 
这 一 事实 对 组 合 电路 的 处 理 速度 有 重要 的 实际 影响 。 当 
改变 门 的 一 个 输入 信号 时 ， 输 出 不 会 马上 做 出 响应 。 信 
号 会 通过 门 的 内 部 电子 元 件 ， 存 在 时 间 上 的 延迟 。 门 输 
出 对 输入 改变 做 出 响应 要 花费 的 时 间 称 作 门 延迟 ( gate 
delay)。 采 用 不 同 制造 工艺 的 门 具 有 不 同 的 门 延 迟 。 制 
造 延迟 短 的 门 要 更 贵 一 些 ， 这 种 门 比 延迟 长 的 门 需要 更 
多 的 电能 来 运行 。 虽 然 不 同 设 备 技 术 导致 门 延 迟 差 异 很 
大 ， 但 典型 的 门 延迟 是 2ns (nanosecond， 纳 秒 )。 
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图 10-18 图 10-16 表达 式 的 真 值 表 
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十 亿 分 之 二 秒 对 于 等 待 输 出 好 像 不 是 一 段 很 长 的 时 间 ， 但 是 如 果 一 个 电路 有 一 长 串 的 
门 ， 必 须 循环 进行 处 理 ， 那 么 这 段 时 间 就 有 可 能 很 长 了 。 假 设 信 和 号 以 近似 3.0 x 10°m/s 的 光 
速 通过 线路 ， 也 就 是 Ins 通过 30cm。 典 型 门 延迟 2ns 内 ， 信 和 号 能 通过 60cm 的 线路 。 相 比 于 
集成 电路 或 电路 板 的 尺寸 ， 这 是 相当 长 的 距离 ， 所 以 实际 上 门 延迟 决定 了 网 络 处 理 速度 。 
思考 图 10-16 的 电路 ， 如 果 门 延迟 是 2ns，2 的 一 个 变化 传 过 AND 门 需要 
2ns， 传 过 XOR 门 需要 2ns， 传 过 NOR 门 需要 2ns， 即 需要 ons 的 传播 时 间 (忽略 经 过 反 相 
x=(a'be ®c+at+d)' 


=a’ bd’+a'c'd' - 


图 10-19 展示 的 是 相应 的 电路 。 因 为 输入 的 改变 只 需 ”图 10-19 等 效 于 图 10-16 电 路 
要 2 个 门 延迟 就 传播 到 输出 ， 因 此 叫 作 两 级 电路 。 a 的 两 级 AND-OR 电路 

将 处 理 时 间 从 6ns 缩短 到 4ns， 意 味 着 33% 的 速度 提 
升 ， 效 果 非 常 显 著 。 因 为 任何 布尔 表达 式 都 能 转换 成 AND-OR 表达 式 ， 而 AND-OR 表达 式 
又 对 应 两 级 AND-OR 电路 ， 所 以 任何 函数 都 可 以 用 最 多 有 两 个 门 延 迟 处 理 时 间 的 组 合 电路 
来 实现 。 

同样 的 理论 也 适用 于 对 偶 原则 。 总 是 可 以 把 布尔 表达 式 转换 成 OR-AND 表达 式 ，OR- 
AND 表达 式 对 应 两 级 电路 ， 这 样 的 两 级 电路 最 多 有 两 个 门 延 迟 的 处 理 时 间 。 要 得 到 布尔 
表达 式 的 OR-AND 表达 式 ， 可 以 首先 得 到 AND-OR 表达 式 的 补 ， 然 后 使 用 德 . 摩根 定律 
即 可 。 

memes 图 10-20 是 图 10-17 的 表达 式 


髓 的 传播 延迟 )。 
现在 考虑 用 布尔 代数 把 这 个 电路 写成 AND-OR 形式 的 
表达 式 : 


ann ASA 


x=(a+ b'+c)(a'+ b'+ c) b 
的 两 级 OR-AND 电路 。 回 想 一 下 ， 每 个 OR 项 对 应 真 值 表 g 
中 的 一 个 0. 加 4 
10-13 的 表达 式 是 图 10-20 图 10-17 的 两 级 OR- 
sistas AND 电路 
要 把 这 个 表达 式 转 换 成 OR-AND 表达 式 ， 首 先 写 出 它 的 补 
x'=(a + b’c)’ 
=a (b'c) 
=a(b+c’') 
=a'b + a'c' 
这 是 一 个 AND-OR 表达 式 。 青 使 用 德 * 摩根 定律 把 x 写成 
x=(x')' 
=(a'b + a'c')' 
=(a'b)(a'c')' 
=(a + b')\(a + c) 
这 就 是 一 个 OR-AND 表达 式 了 。 = 


通常 三 级 或 更 多 级 的 电路 比 等 价 的 两 级 电路 所 需 的 门 更 少 。 因 为 门 占用 集成 电路 的 物理 
空间 ， 所 以 尽管 两 级 电路 能 达到 更 快 的 处 理 速 度 ， 但 代价 是 为 更 多 的 门 提 供 额 外 的 空间 。 


RIŽ AA eK 397 


这 也 是 计算 机 科学 中 一 个 空间 / 时 间 折 中 的 例子 。 值 得 注意 的 是 从 高 抽象 层次 的 软件 到 
低 抽象 层次 的 硬件 ， 都 有 这 样 的 空间 / 时间 问 题 ， 这 确实 是 一 个 基本 问题 。 


10.2.4 无 处 不 在 的 NAND 
表达 式 (abc)' 表 示 一 个 三 输入 NAND I], W- 摩根 定律 表述 为 


(abc)'=a'+ b'+c' 
可 以 把 第 二 个 表达 式 想象 成 一 个 OR 门 的 输出 ， 这 个 OR 门 在 执行 OR 运算 前 把 每 个 输 
ARH. ERRE NAND 门 画 成 反 相 输入 的 NOR， 如 图 10-21a 所 示 。 


a) 由 反 相 输入 的 OR 门 构成 的 NAND 门 b) 由 反 相 输 入 的 AND 门 构成 的 NOR 门 
图 10-21 等 价 门 
从 对 偶 表 达 式 得 出 
(a+b+c)=a'b'c' 
NOR 门 等 价 于 反 相 输入 的 AND 门 ， 如 图 10-21b 所 示 。 
将 这 个 理念 进一步 运用 到 两 级 电路 。 考 虑 
abc + def =((abc)'(def )')' 
的 等 价 表 达 式 ， 这 也 可 以 从 德 ， 摩根 定律 得 出 。 第 一 个 表达 式 表 示 一 个 两 级 AND-OR 电路 ， 
而 第 二 个 表示 的 是 一 个 两 级 的 NAND-NAND 电路 。 图 10-22 展示 的 是 这 些 等 价 的 电路 。 


a a a 
b b b 
C € Ç 
d d d 
e e e 
fà f f 
a) AND-OR 电路 b) 等 价 的 NAND-NAND 电路 c) 与 b 相 同 的 NAND-NAND 电路 


图 10-22 一 个 AND-OR 电路 及 其 等 价 的 NAND-NAND 电路 


图 10-22a 展示 的 是 一 个 AND-OR 电路 ， 它 有 两 个 AND 门 和 一 个 OR 门 。 也 可 以 完全 
用 NAND 门生 成 等 价 电 路 ， 如 图 10-22b 所 示 。 除 了 最 后 的 NAND 画 成 了 反 相 输入 的 OR 之 
外 ， 图 10-22c 和 图 10-22b 是 一 样 的 。 这 种 画 法 可 以 明显 看 出 AND 运算 后 面 的 求 补 和 OR 
运算 前 面 的 求 补 抵消 了 ， 门 符号 变 成 了 和 AND-OR 电路 中 类 似 的 形状 ， 这 有 助 于 表达 电路 
的 含义 。 

不 仅 可 以 用 NAND 门 来 完全 替换 任意 的 AND-OR 电路 ， 而 且 可 以 通过 把 NAND 输入 
连接 到 一 起 ， 由 NAND 门 得 到 反 相 器 ， 如 图 10-23 所 示 。 因 为 NAND HAA afi b AE 
(ab)'"， 如 果 指 定 bp=a， 那 么 门将 生成 (a* a)'=a', Ma 的 补 。 
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从 理论 上 来 说 ， 可 以 仅 用 NAND 门 构建 任何 组 合 电路 。 此 外 ，NAND 门 通常 比 AND 门 和 
OR 门 更 容易 制造 ， 因 此 NAND 门 是 目前 集成 电路 中 最 常用 的 门 。 

当然 ， 同 样 的 原理 也 适用 于 对 偶 电 路 。 两 级 电路 的 德 ， 摩根 tf 
定律 是 

(a+b+c\d+e+f)=((at+b+c)+(d+etf)')' 

这 说 明 OR-AND 电路 等 价 于 NOR-NOR 电路 。 图 10-24 是 :十 > 
图 10-22 的 对 偶 电路 。 

适用 于 NAND 电路 的 推理 同样 适用 于 NOR 电路 。 任 何 组 合 
电路 都 可 以 写成 一 个 两 级 OR-AND 电路 ， 这 个 两 级 电路 可 以 写成 > 
NOR-NOR 电路 。 连 接 NOR 的 输入 可 以 得 到 反 相 器 。 理 论 上 仅 用 ”图 10-23 三 个 等 价 电路 
NOR 门 就 可 以 构建 任何 组 合 电 路 。 
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a) OR-AND 电路 b) 等 价 的 NOR-NOR 电路 c) 与 b 相 同 的 NOR-NOR 电路 
图 10-24 一 个 OR-AND 电路 及 其 等 价 的 NOR-NOR 电路 
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10.3 组 合 设计 


两 级 电路 的 高 速 是 其 优 于 两 级 以 上 门 电路 的 优势 。 有 时 候 ， 在 两 级 电路 中 减少 门 的 数量 
并 保持 两 级 门 延迟 的 处 理 速度 是 可 行 的 。 

布尔 表达 式 

x (a, b, c, d)=a'bd'+ a'c'd'+ a'bc'd' 
可 以 用 吸收 率 简化 为 
x (a, b, c, d)=a'bd'+ (a'c'd') + (a‘cd'\)b 
=a'bd'+ a'c'd' 

这 个 表达 式 也 对 应 于 两 级 电路 ， 但 是 它 只 需要 两 个 三 输入 AND 门 和 一 个 两 输入 OR 门 ， 而 
原始 表达 式 对 应 的 电路 需要 三 个 AND 门 和 一 个 三 输入 OR 门 ， 其 中 一 个 AND 门 还 需要 四 
输入 。 5 

用 布尔 代数 来 简化 两 级 电路 中 门 的 数量 并 不 总 是 简单 明了 的 。 本 节 给 出 一 种 图 形 化 的 方 
法 来 设计 具有 3 个 或 4 个 变量 且 门 数量 尽 可 能 少 的 两 级 门 电路 。 
10.3.1 范式 

上 一 节 讲 述 了 任何 布尔 表达 式 都 能 转换 成 一 个 两 级 AND-OR 表达 式 。 要 简化 两 级 电路 ， 
首先 要 使 每 个 AND 项 只 包含 所 有 输入 变量 一 次 ， 这 样 的 AND 项 称 为 极 小 项 (minterm ) 。 
AND-OR 表达 式 总 是 可 以 转换 成 极 小 项 的 OR。 

考虑 布尔 表达 式 


x(a, b, c)=abc + a'bc + ab 
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因为 前 两 个 AND 项 包含 所 有 三 个 变量 ， 因 此 它们 是 极 小 项 ， 但 最 后 一 个 不 是 。 转 换 过 
程 如 下 : 
x=abc + a'bc + ab 
=abc +a'bc + ab(c +c’) 
=abc + a'bc + abc + abc' 
=abc + a'bc + abc' 
最 后 的 表达 式 称 为 范式 (canonical expression)， 因 为 它 是 没有 重复 的 极 小 项 的 OR。 
范式 中 的 每 个 极 小 项 代表 真 值 表 里 的 一 个 1， 所 以 范式 直接 和 真 值 表 相 关 。 范 式 及 其 对 
应 真 值 表 的 方便 的 简化 表示 法 叫 作 西格玛 表示 法 ( sigma notation)， 它 由 大 写 希 腊 字母 西 格 
玛 ( 3) 后 面 跟 一 组 十 进 制 数字 组 成 ,这些 数字 对 应 真 值 表 中 包含 1 的 行 ， 大写 的 西格玛 代 
表 OR 运算 。 不 言 而 喻 ,没有 列 出 的 行 都 是 包含 0 的 行 。 
在 例 10.20 中 ， 因 为 x 的 范式 有 3 个 极 小 项 ， 因 此 
它 的 真 值 表 有 3 个 1。 图 10-25 展示 的 是 这 个 函数 的 真 值 表 ， 每 
一 行 都 标记 有 一 个 十 进 制 数 ， 对 应 于 二 进 制 数 apc。 这 个 函数 对 
应 的 西格玛 表示 为 
x(a, b, c)=>(3,6,7) 
因为 第 3、6 和 7 行 含有 1. = 
对 偶 范 式 是 一 个 OR-AND 表达 式 ， 它 的 每 一 项 只 包含 所 有 变 
量 一 次 ,没有 重复 的 OR 项 。 这 个 范式 相应 的 表示 法 包含 的 是 真 
值 表 中 0 组 成 的 列表 。 这 里 使 用 大 写 希 腊 字 母 派 ( 工 ) 表示 AND 
运算 ， 而 不 是 西格玛 。 
电 昨 Re 隐 闻 前面 例子 的 对 偶 范 式 为 
x(a,b,c=(a+b+c)(a+b+c Nat+b+ c)(a b + o)(a'+ b+c’) — 
用 派 表示 法 可 以 写成 图 10-25 范式 的 真 值 表 
x (a, b, c)=II(0, 1, 2, 4, 5) 
因为 这 5 行 在 真 值 表 里 为 0。 s 
使 用 西格玛 表示 法 ,图 10-3 中 x Ay 为 
x (a, b,c) => (1, 3) 
y (a, b,c)=5 (3,4) 





ae gh (ered IN 


图 10-4 中 函数 x 和 上 为 
x (a, b, c, d) => (5, 7, 13, 15) 
y (a, b, c, d) =Ñ (4, 5, 12, 13) a 
西格玛 和 派 表示 法 要 比 布尔 范式 和 真 值 表 更 简洁 。 本 节 剩 下 的 部 分 假设 要 简化 的 函数 已 
经 转换 为 它 的 唯一 范式 ， 或 者 说 已 经 给 定 或 确定 了 真 值 表 。 


10.3.2 三 变量 卡 诺 图 

两 级 电路 的 简化 是 基于 距离 的 概念 。 两 个 极 小 项 之 间 的 距离 (distance) 是 它们 不 同 之 处 
的 数量 。 

来 看 一 下 这 个 三 变量 函数 的 范式 : 


x(a, b, c)=a'bc + abc + abc' 
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极 小 项 albc 和 abe 之 间 的 距离 是 1， 这 是 因为 a' 和 a 是 这 两 个 极 小 项 唯一 不 同 的 变量 ， 
两 者 中 变量 b 和 cc 是 相同 的 。 极 小 项 abe 和 abe' 的 距离 是 2， 这 是 因为 a%bc 中 的 wa 和 与 
abc' 中 的 a 和 c' 不 相同 。 m 

识别 相 邻 极 小 项 (adjacent minterm)， 即 距离 为 1 的 极 小 项 ， 是 简化 AND-OR 表达 式 
的 关键 。 一 旦 找到 两 个 相 邻 极 小 项 ， 就 可 以 用 分 配 律 提 出 公共 项 ， 再 用 取 补 和 徊 等 性 简 
化 它 。 

可 以 像 下 面 那样 合并 前 两 个 极 小 项 来 简化 例 10.24 中 的 表达 式 : 

x(a, b, c)=a'be + abc + abc' 
=(a'+ a)bc + abc' 
=bc + abc' 

或 者 可 以 合并 第 二 和 第 三 个 极 小 项 ， 因 为 它们 也 是 相 邻 的 。 
x(a, b, c)=a'bc + abc + abc' 
=a'be + ab(c +c’) 
=a'be + ab 

无 论 哪 种 方式 都 改进 了 电路 。 原 表达 式 是 一 个 有 三 个 三 输入 AND 门 和 一 个 三 输入 OR 
门 的 电路 。 两 个 简化 表达 式 对 应 的 电路 都 仅 有 两 个 AND 门 ， 其 中 之 一 仅 有 两 个 输入 ， 以 及 
一 个 仅 有 两 输入 的 OR 门 。 

识别 相 邻 极 小 项 是 很 容易 的 。 为 了 得 到 更 小 的 最 终 电路 ， 有 时 候 会 临时 使 表达 式 更 加 复 
杂 。 当 一 个 极 小 项 和 其 他 两 个 极 小 项 相 邻 时 就 会 发 生 这 样 的 情况 ， 可 以 用 和 客 等 性 复制 这 个 极 
小 项 ， 再 把 它 和 它 的 两 个 相 邻 极 小 项 合并 。 m 

在 例 10.25 PTAR NEES til abe, ARAA RAUA. 

x(a, b, c)=a'bc + abc + abc' 
=a'be + abc + abc + abc' 
=(44 a)be + ab(c +c’) 
=bc + ab 
这 个 结果 要 好 于 例 10.25 中 的 结果 ， 因 为 两 个 AND 门 都 只 有 两 个 输入 。 m 

用 布尔 代数 进行 简化 枯燥 且 容 易 出 错 。 卡 诺 图 是 一 个 简化 两 级 电路 的 工具 ， 它 能 很 容易 
地 找 出 相 邻 极 小 项 ， 确 定 需 要 用 震 等 性 复制 哪些 项 。 卡 诺 图 只 是 一 个 组 织 过 的 真 值 表 ， 相 邻 
的 条 目 代 表 只 有 一 个 不 同 之 处 的 极 小 项 。 

图 10-26a 展示 的 是 一 个 三 变量 卡 诺 图 。 左 上 单元 代表 abc=0， 它 的 右边 是 代表 abc=001 
的 单元 ， 再 往 右 是 代表 abc=011 的 单元 ， 接 着 是 apc=010。 序 列 000、001、011、010 保证 
了 相 邻 单元 只 有 1 个 不 同 。 如 果 按 照 数字 顺序 排列 单元 000、001、010、011 就 不 会 有 这 种 
效果 了 ， 因 为 001 和 010 的 距离 是 2。 


bc 





a) 卡 诺 图 b) b= 1 的 区 域 cj) c=0 的 区域 
图 10-26 一 个 三 变量 函数 的 卡 诺 图 
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图 中 最 上 面 的 一 行 包含 了 真 值 表 中 a=0 的 条 目 ， 最 下 面 一 行 包 含 了 al 的 条 目 。 每 一 

列 是 be 的 值 ， 例 如 ， 第 一 列 是 bc=00， 第 二 列 是 bc=01， 最 左边 两 列 是 b=0， 最 右边 两 列 是 
=1， 如 图 10-26b 所 示 。 外 边 的 两 列 是 c=0， 中 间 的 两 列 是 c=1， 如 图 10-26c 所 示 。 

用 布尔 代数 提取 出 相 邻 极 小 项 的 公共 项 相当 于 在 卡 诺 图 上 将 相 邻 单元 组 成 一 组 。 在 对 单 
元 分 组 之 后 ， 通 过 检查 卡 诺 图 的 区 域 可 以 写 出 简化 项 。 

图 10-27a 展示 的 是 范式 

x(a, b, c)=a'be + a'bc' 

的 卡 诺 图 。 


bc bc 
01 11 


11 
ponon Te 
a) FRA b) 简化 

图 10-27 fai] 10.27 中 AND-OR 表达 式 的 卡 诺 图 


abc=011 对 应 单元 中 的 1 是 极 小 项 a'be 的 真 值 表 单元 ，abc=010 对 应 单元 中 的 1 是 极 小 
项 a'bc' 的 真 值 表单 元 。 图 10-27b 是 同样 的 卡 诺 图 ， 只 是 为 了 清晰 省 略 了 0。 因 为 这 两 个 1 
是 相 邻 的 ， 所 以 可 以 用 椭圆 把 它们 圈 起 来 。 椭 圆 覆 盖 的 单元 是 a=0 的 行 和 b=1 的 列 ， 因 此 
是 ab=01 的 区 域 ， 这 对 应 于 a'b Hh, Alt x(a, b, c)=a%b。 可 以 不 用 布尔 代数 ， 仅 通过 观察 卡 
诺 图 就 写 出 结果 。 = 
图 10-28 展示 的 是 范式 
x(a, b, c)=ab'c' + abc' 


的 卡 诺 图 。 


be 


a) FEK b)a 区域 
图 10-28 fj 10.28 的 AND-OR 表达 式 的 卡 诺 图 


看 上 去 ab'c' 单 元 在 左下 角 ，ab'c 单元 在 右 下 角 ， 两 者 是 不 相 邻 的 ， 但 是 实际 上 它们 是 
相 邻 的 。 应 该 把 卡 诺 图 想象 成 环绕 的 ， 因 此 它 的 左边 和 右边 是 相 邻 的 ， 这 就 是 所 谓 的 Pac- 
Man 效应 。 在 图 中 将 一 个 椭圆 画 成 了 两 个 开放 的 半 椭 圆 来 表达 卡 诺 图 的 这 个 属性 。 
这 两 个 单元 都 位 于 a=1 行 和 c=0 列 ， 如 图 10-28b 和 图 10-28c 所 示 。 可 以 把 两 个 单元 想 
象 成 图 中 阴影 区 域 的 交集 ， 这 个 区 域 是 ac=10。 因 此 简化 的 函数 是 x(a, b, c)=ac'。 m 
FES RES EDA, EE ARAARA, TERR 
两 个 椭圆 的 重 肆 。 如 果 AND-OR 表达 式 中 不 止 两 个 极 小 项 ， 那 么 就 可 以 随意 把 真 值 表 中 的 
1 与 多 个 组 合 使 用 。 
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图 10-29 展示 的 是 


x(a, b, c)=a'bc + abe + 


abc' 


的 卡 诺 图 ， 这 是 例 10.26 的 范式 。 图 10-299 展示 的 是 合并 第 一 和 第 二 极 小 项 的 简化 ， 图 10-29b 
展示 的 是 合并 第 二 和 第 三 极 小 项 的 简化 ， 图 10-29c 中 两 个 简化 都 用 到 了 第 二 项 ， 对 应 于 两 


个 椭圆 的 重 和 。 


g 


b 


1 


HE AGS) As 


c 


a) a'bc + abc = bc b) abe + abc’ = 


ab c)x=be+ab 


图 10-29 fj 10.26 的 AND-OR 表达 式 的 卡 诺 图 
当 原始 的 真 值 表 采 用 西格玛 表示 法 时 ， 可 以 在 卡 诺 图 中 1 的 位 置 插入 图 10-30 所 示 的 十 


进 制 标号 。 

简化 的 过 程 就 是 要 确定 最 好 的 一 组 椭圆 来 覆盖 卡 
诺 图 中 所 有 的 1。“ 最 好 ”的 意思 是 这 组 椭圆 对 应 于 一 
个 两 级 电路 ， 它 有 最 少 的 门 ， 每 个 门 有 最 少 的 输入 。 
椭圆 的 数量 等 于 AND 门 的 数量 ， 一 个 椭圆 覆盖 的 1 
越 多 ， 对 应 的 AND 门 的 输入 就 越 少 。 所 以 要 得 到 最 
少 的 椭圆 数 ， 每 个 椭圆 要 尽 可 能 多 地 覆盖 所 有 的 1 而 
不 覆盖 0。 人 允许 1 被 多 个 椭圆 覆盖 。 下 面 几 个 例子 展 
示 了 确定 椭圆 的 一 般 策 略 。 


ee 


11 


图 10-30 ” 卡 诺 图 极 小 项 的 十 进 制 标号 


图 10-31 展示 的 是 一 个 简化 时 常见 的 错误 。 要 简化 


x(a, b, c)= > (0, 1, 5, 


7) 


可 能 首先 想 组 合 极 小 项 1 和 5， 如 图 10-31a 所 示 。 一 开始 就 这 样 做 并 不 好 ， 因 为 极 小 项 1 与 


0 和 5 都 相 邻 ， 极 小 项 5 与 1 和 7 都 相 邻 。 另 一 方面 ， 
的 椭圆 覆盖 极 小 项 0， 就 必须 将 它 和 1 组 合 。 类 似 地 ， 
的 椭圆 覆盖 它 ， pees 5 组 合 。 


0l 1l 


极 小 项 0 只 和 1 相 邻 。 要 用 尽 可 能 大 
极 小 项 7 只 和 5 相 邻 ， 要 用 尽 可 能 大 


Ace D | | 
CHCOOH (Sep | |e | 
a) 错误 策略 b) 错误 策略 的 结果 c) 正确 的 简化 
图 10-31 一 开始 选择 不 好 的 结果 


图 10-31b 展示 的 是 这 种 极 小 项 分 组 的 结果 ， 代 表 表 达 式 





x(a, b, c)=¥ (0, 1, 5, 7) 
=a'b'+ b'c + ac 
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这 需要 3 个 两 输入 AND 门 和 1 个 三 输入 OR 门 。 但 第 一 个 分 组 选择 并 不 是 必需 的 。 
10-31c 给 出 了 正确 的 简化 ， 它 表示 
x(a, b, c)=¥ (0, 1, 5, 7) 
=a'b'+ ac 
这 个 实现 只 需要 两 个 两 输入 AND 门 和 一 个 两 输入 OR 门 。 a 
前 面 的 例子 告诉 我 们 一 个 经 验 法 则 ， 即 从 只 有 一 个 最 近邻 居 的 极 小 项 开始 分 组 ， 因 为 无 
论 如 何 邻 居 必 须 和 它们 一 起 分 组 ， 这 样 可 以 节省 一 个 不 必要 的 邻居 组 成 的 分 组 。 
另 一 个 常见 的 错误 是 无 法 找到 一 个 大 的 1 的 分 组 ， 如 例 10.31 所 示 。 
图 10-32a 展示 的 是 一 个 三 变量 函数 的 简化 
x(a, b, c)= È (0, 2, 4, 6, 7) 
=b'c'+ be'+ ab 
要 三 个 两 输入 AND 门 和 一 个 三 输入 OR 门 。 图 10-32b 是 正确 的 简化 ， 即 
x(a, b, c)=c'+ ab 





这 只 需要 一 个 两 输入 AND 门 和 一 个 两 输入 OR 门 。 m 
bc 
POA ALLE 
GD 1 LD 
a ) 错误 的 简化 b) 正确 的 简化 


图 10-32 无 法 识别 出 一 个 大 的 分 组 


在 三 变量 问题 中 ， 四 个 1 的 分 组 相当 于 只 有 一 个 变量 的 AND 项 。 因 为 一 个 组 中 1 的 个 
数 一 定 是 对 应 于 a、b、c 以 及 它们 的 补 的 区 域 的 交集 ， 因 此 组 中 1 的 数量 一 定 是 2 RE A 
一 个 椭圆 可 以 覆盖 1、2 或 4 个 1, 但 是 绝 不 会 是 3 或 5 个 1。 


10.3.3 四 变量 卡 诺 图 


四 变量 电路 的 简化 遵循 和 三 变量 电路 一 样 的 步骤 ， 除 了 卡 诺 图 中 条 目的 数量 是 三 变量 的 
两 倍 以 外 。 图 10-33a 是 单 
元 的 排列 。 不 仅 极 小 项 0 和 
2 相 邻 .4 和 6 相 邻 ， 而 且 00 ol 11 10 alias oe se 


极 小 项 12 和 14、8 A 10 也 a Potala |2| 
相 邻 。 同 时 ， 最 行 的 

单元 和 最 下 面 一 n th a, gogg 
元 也 相 邻 ， 即 极 小 项 0 和 8、 11 L2 [as fas f a | 


1 419.3 Al 11.2 #110 FASB. 





三 变量 卡 诺 图 中 每 个 单 
元 有 三 个 相 邻 单元 。 在 四 变 d 
量 卡 诺 图 中 ， 每 个 单元 有 四 a) 卡 诺 图 中 极 小 项 的 十 进 制 标号 b ) 变量 为 1 的 区 域 


个 相 邻 单元 。 例 如 ， 与 10 图 10-33 ”四 变量 函数 的 卡 诺 图 
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相 邻 的 是 2、8、11 和 14, 与 4 相 邻 的 是 0、5、6 和 12。 
图 10-33b 展示 的 是 变量 为 1 的 真 值 表 区 域 。 变 量 a 在 下 面 两 行为 1， 变 量 5 在 中 间 两 
行为 1， 变量 c 在 右边 两 列 为 1， 变量 d 在 中 间 两 列 为 1。 
图 10-34 展示 的 是 对 
x(a, b, c, d)=¥, (0, 1, 2, 5, 8, 9, 10, 13) 
=c'd+b'd' 
的 简化 。 注 意 四 个 角 上 的 单元 可 以 被 组 合成 bp'4'， 卡 诺 图 的 第 二 列 代 表 c'd. a 
图 10-35 展示 的 是 
x(a, b, c, d)=¥, (0, 1, 2, 5, 8, 9, 10) 
=a'c'd + b'e" b'd' 


的 简化 。 和 例 10.32 相 比 ， 尽 管 只 少 了 一 项 ， 但 是 简化 结果 是 完全 不 同 的 。 


cd 
00 01 11 10 





图 10-34 ”四 变量 函数 的 简化 图 10-35 少 了 一 项 的 图 10-34 表达 式 


极 小 项 5 只 有 一 个 相 邻 的 1， 因此 根据 经 验 法 则 首先 将 它 和 极 小 项 1 组 合 ， 这 个 组 合 的 
AND 项 是 acd， 可 以 通过 观察 顶部 两 行 (a”)、 左 边 两 列 (c') 和 中 间 两 列 d) 的 交集 来 确定 。 
用 最 大 的 椭圆 覆盖 极 小 项 9 需要 把 它 与 0、1 和 8 组合， 而 不 是 只 与 8 组合， 这 个 组 合 
的 AND 项 是 b'c'， 可 以 通过 观察 项 部 和 底部 行 (b') 与 左边 两 列 Ce) 的 交集 来 确定 。 
剩 下 还 没有 被 覆盖 的 1 是 极 小 项 2 和 10， 和 前 面 一 样 ， 它 们 与 0 和 8 AA. = 
图 10-36 展示 的 简化 结果 可 能 不 是 唯一 的 。 下 面 这 个 函数 有 两 个 合法 的 简化 
结果 
x(a, b, c, d) => (0, 4, 7, 8, 12, 13, 15) 
= c'd't bed + abc' 
=c'd'+ bed + abd 





d 
a) 一 种 可 能 的 简化 b) 另 一 种 不 同 的 简化 
图 10-36 ”两 种 不 同 的 正确 简化 
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首先 应 该 组 合 的 极 小 项 是 7， 因 为 它 只 有 一 个 相 邻 项 1。 极 小 项 0 必须 和 4、8 和 12 组 
合 ， 因 为 它 没有 其 他 可 能 的 组 合 方式 。 这 样 就 只 剩 下 13 了 ， 它 可 以 和 12 或 者 15 组 合 。 m 

简化 四 变量 函数 并 不 总 是 简单 明了 的 ， 有 时 候 为 了 确定 真正 最 小 的 结果 ， 必 须 尝试 几 种 
不 同 的 组 合 。 

图 10-37 展示 的 就 是 这 样 的 问题 。 该 函数 为 

> (0, 1, 2, 3, 5, 6, 7, 8, 9, 12, 13, 14) 

图 10-37a 是 下 面 推理 的 结果 。 来 看 极 小 项 12， 它 所 属 的 最 大 组 是 对 应 ac' 的 四 项 组 ， 
类 似 的 极 小 项 6 所 属 的 最 大 组 合 是 四 项 组 gc。 给 定 这 两 个 组 合 ， 可 以 把 极 小 项 5 组 合 到 cd 
中 ， 极 小 项 0 组 合 到 a2' 中 ， 极 小 项 14 组 合 到 bed’ 中 。 表 达 式 

ac'+ a'e+c'd+a'b'+ bed' 
似乎 是 合理 的 ， 因 为 没有 哪个 组 合 看 上 去 是 元 余 的， 去 掉 任 何 一 个 椭圆 都 会 有 1 没 被 覆 


盖 到 。 





a) 似是而非 的 简化 b ) 正确 的 简化 
图 10-37 一 个 复杂 的 简化 问题 


给 定 前 两 组 的 选择 ,余下 的 三 个 组 合 可 能 都 是 最 好 的 选择 。 问 题 就 在 于 第 二 组 的 选择 。 

10-37b 是 下 面 推 理 的 结果 。 和 前 面 一 样 ， 极 小 项 12 在 
组 合 ac 中 。 现 在 来 考虑 极 小 项 14， 它 必须 和 12 或 者 6 组 合 。 
因为 12 已 经 被 覆盖 了 ， 所 以 14 和 6 组合。 把 剩 下 的 0、1、2、 
3、5、7 组 合 到 一 起 是 最 有 效 的 ， 如 图 10-37b 所 示 。 得 到 的 
表达 式 

ac'+ a'd + a'b'+ bed' 

比 图 10-37a 少 一 个 AND 门 。 

这 是 一 个 麻烦 的 问题 ， 因 为 通常 应 该 用 最 大 可 能 的 组 合 
来 覆盖 1。 然 而 通用 的 规则 不 适用 于 这 个 问题 。 一 旦 确定 了 组 





4c'， 就 不 该 把 极 小 项 6 放 进 最 大 的 可 能 的 组 里 了 。 Hal 10-38: LAGS aS 
通过 图 10-38 可 以 看 到 这 个 问题 的 解决 方案 不 是 唯一 的 ， 一 种 正确 的 简化 
它 首先 把 极 小 项 6 组 合 在 ac 中 ， 接 着 把 14 和 12 组 合 ， 结 
果 为 
a'c+b'c'+- c'd + abd' 国 


在 面 对 一 个 复杂 的 卡 诺 图 时 ， 如 何 才 能 知道 该 怎样 组 合 极 小 项 呢 ? 其 实 就 是 需要 多 练 
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习 、 推 理 和 一 点 点 试验 。 


10.3.4 WAFER 
为 了 简化 OR-AND 表达 式 函 数 ， 可 以 简化 AND-OR 表达 式 形 式 的 函数 的 补 ， 使 用 
fi - 摩根 定律 。 
图 10-39 展示 的 是 对 图 10-29 中 函数 的 补 的 简化 。 原 函数 是 
x(a, b, c)= 7 (3, 6,7) 


=I (0, 1,2, 4,5) be 
它 的 补 如 图 所 示 简 化 为 11 10 
x' (a, b,c)= } (0, 1, 2, 4, 5) 0 
= b+ a'c" EE 
简化 后 的 OR-AND 表达 式 的 原 函 数 是 SUD mm 
x (a, b, c) = (x(a, b, c))' 图 10-39 图 10-29 函数 的 补 
= (b+ a'c’)' 
= b(a+c) 


简化 的 AND-OR 表达 式 
x (a,b,c) =bc + ab 
需要 3 个 门 ， 而 这 个 表达 式 只 需要 两 个 门 。 = 
在 上 面 的 例子 中 ， 用 一 个 两 级 NOR-NOR 电路 而 不 是 NAND-NAND 电路 来 实现 函数 是 
很 划算 的 。 通 常情 况 下 ， 必 须 简 化 两 种 格式 来 确定 哪个 需要 更 少 的 门 。 


10.3.5 无关 条 件 


有 时 候 组 合 电路 设计 只 是 为 了 处 理 某 些 输入 的 组 合 ， 其 他 组 合 永远 不 会 出 现在 输入 
中 。 即 使 这 些 条 件 出 现 我 们 也 不 关心 输出 是 什么 ， 所 以 这 些 组 合 称 为 无 关 条 件 (don’t care 
condition) 。 

在 简化 过 程 中 ， 无 关 条 件 会 带 来 额外 的 灵活 性 。 当 存在 无 关 条 件 时 ， 可 以 随意 设计 电 
路 产生 0 或 1 。 通 过 有 选择 地 让 一 些 无 关 条 件 生 成 1 ， 另 一 些 生成 0， 这 样 可 以 改进 简化 
结果 。 

图 10-40a 是 不 用 无 关 条 件 进 行 简化 

x(a, b, c)=¥ (2, 4, 6) 


=be'+ ac' 
oe 
ll 10 
pia 
机 tl felt 
| 总 —— 
a) 不 使 用 无 关 条 件 的 函数 简化 b ) 同样 的 函数 使 用 无 关 条 件 的 简化 


图 10-40 无 关 条 件 
现在 假设 不 用 极 小 项 0 和 7 生成 0， 在 这 个 问题 中 ， 这 两 个 极 小 项 可 以 生成 0 也 可 以 生 


FIOF 组 会 电路 407 


成 1。 这 个 描述 用 符号 表示 为 
x(a, b, c)}= 7 (2, 4, 6)+ d(0, 7) 

这 里 在 极 小 项 标号 前 面 的 4 代表 无 关 条 件 。 图 10-40b 的 卡 诺 图 中 标记 为 ”x ”的 单元 
就 表示 无 关 条 件 。 

当 用 无 关 条 件 进行 简化 时 ， 可 以 自由 地 覆盖 或 者 不 覆盖 标记 为 “x ”的 单元 。“x ”就 
像 通配符 ， 把 它 看 作 0 或 1 均 可 。 在 本 例 中 ， 如 果 把 极 小 项 0 看 作 1， 极 小 项 7 看 作 0， 简 
化 的 结果 就 是 

x(a, b, c) = ¥, (2, 4, 6)+ d(0, 7) 
=F (0, 2, 4, 6) 
=" 

不 用 无 关 条 件 ， 这 个 函数 需要 两 个 AND 门 和 一 个 OR 门 ， 如 果 使 用 无 关 条 件 ， 就 不 需 

要 AND 门 或 者 OR 门 了 。 加 


10.4 组 合 设备 


本 节 讲 述 一 些 在 计算 机 设计 中 普遍 用 到 的 组 合 设备 。 每 个 设备 都 可 以 被 描述 成 一 个 黑 盒 
子 ， 有 一 个 对 应 的 真 值 表 定义 了 输出 和 输入 的 关系 。 本 节 的 所 有 设备 都 是 组 合 设备 ， 可 以 用 
两 级 AND-OR 电路 来 实现 。 这 里 展示 的 一 些 实现 用 处 理 时 间 来 换取 更 小 的 空间 ， 即 更 少 的 
门 ， 可 能 不 止 两 级 。 


10.4.1 视角 


下 面 的 几 个 设备 有 一 条 叫 作 使 能 (enable) 的 输入 线 。 使 能 线 就 像 设 备 的 开关 ， 如 果 使 
能 线 为 0， 不 管 输入 线 的 值 是 什么 ， 输 出 线 都 是 0。 此 时 ， 设 备 为 关闭 或 禁用 状态 。 如 果 使 
能 线 为 1， 根 据 描述 这 个 设备 的 函数 ， 输 出 线 由 输入 决定 。 此 时 ， 设 备 为 打开 或 使 能 状态 。 

AND 门 可 以 实现 使 能 属性 ， 如 图 10-41a 所 示 。 线 a 是 一 个 组 合 电 路 (没有 在 图 中 显 
示 ) 的 一 个 输出 ， 该 电路 需要 一 个 使 能 线 作 为 开关 来 控制 其 打开 或 关闭 。 可 以 将 a 送 入 一 个 
AND 门 ， 并 把 该 AND 门 的 另 一 个 输入 用 作 使 能 线 。 

当 使 能 线 为 1 AY, 


x=a + (enable) 


输出 等 于 输入 ， 如 图 10-41b 所 示 。 当 使 能 线 为 0 时 ， 如 图 10-41c 所 示 ， 不 管 输入 是 
ABs 
x=a * (enable) 
=a:0 
=0 
实现 使 能 属性 不 需要 一 个 新 的 “使 能 门 ”， 只 需 用 一 个 不 同 的 视角 来 看 待 我 们 熟悉 的 
AND 门 。 可 以 把 输入 a 看 作 数据 线 ， 把 使 能 线 看 作 控制 线 。 使 能 通过 让 数据 完全 不 变 地 通 
过 门 或 者 阻止 它 通过 门 来 控制 数据 。 
另 一 个 很 有 用 的 门 是 选择 反 相 器 (selective inverter)。 输 入 有 一 条 数据 线 和 一 条 反 相 线 。 
如 果 反 相 (invert) 线 为 1， 那么 输出 是 数据 线 的 补 ; 如 果 反 相 线 为 0， 输入 不 改变 地 通过 门 
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到 达 输 出 。 





使 能 线 
a) 使 能 门 的 逻辑 图 b) 设备 打开 时 的 真 值 表 c) 设备 关闭 时 的 真 值 表 


图 10-41 AND 的 输入 作为 使 能 


从 图 10-42a 可 以 看 到 选择 反 相 器 是 一 个 XOR 门 ， 只 不 过 换 了 一 个 和 以 往 不 一 样 的 视角 
来 看 。 当 反 相 线 为 1 时 ， 


x=a ® (invert) 
=a'+ (invert) + a * (invert)’ 
=a': l +a- l' 


N 
输出 等 于 数据 输入 的 补 ， 如 图 10-42b 所 示 。 当 反 相 线 为 0 时 ， 
x=a @ (invert) 
=4" (invert) + a * (invert)’ 





=a" 0+ a+ 0 
=a 
数据 线 不 改变 地 通过 这 个 门 。 
a 
J 
| 
反 相 线 i i 
a) 选择 反 相 器 的 逻辑 图 b) 反 相 器 打开 时 的 真 值 表 c ) 反 相 器 关闭 时 的 真 值 表 


10-42 XOR 的 输入 作为 反 相 选 择 


10.4.2 复 用 器 


SAS (multiplexer) 是 从 几 个 数据 输入 中 选择 一 个 并 送 到 唯一 的 数据 输出 的 设备 。 控 
制 线 决定 要 让 哪个 数据 输入 通过 。 

图 10-43a 展示 的 是 一 个 八 输入 复 用 器 的 框图 。D0 ~ D7 是 数据 输入 线 ，S2 ~ SO 是 选 
择 控制 线 , F 是 唯一 的 输出 线 。 

由 于 这 个 设备 有 11 个 输入 ， 所 以 完整 的 真 值 表 需 要 2”=2048 个 条 目 。 图 10-43b 是 
一 个 简略 的 真 值 表 ， 第 二 个 条 目 显 示 当 选择 线 是 001 时 , 输出 是 D1。 也 就 是 不 管 D0 和 
D2 ~ D7 为 何 值 ， 如 果 D1 为 1, F 就 为 1， 如 果 D1 为 0, 就 为 0。 

因为 n 条 选择 线 可 以 选择 2" 条 数据 线 之 一 ， 所 以 复 用 器 的 数据 输入 的 数量 是 2 的 寡 。 
图 10-44 展示 了 一 个 四 输入 复 用 器 的 实现 ， 它 包含 四 条 数据 线 DO ~ D3， 和 两 条 选择 线 S1 
和 S0。 
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DO 
Sl 
So’ 


DI 
SI’ 
SO 


D2 
Sl 
so' 


Tt} 
$2 Sl SO 
a) 框图 


图 10-43 八 输入 的 复 用 器 图 10-44 四 输入 复 用 器 的 实现 


Pep/9 中 STWr 指令 的 实现 是 应 用 复 用 器 的 一 个 例子 。 这 条 指令 把 CPU 两 个 寄存 器 之 一 
的 内 容 通过 总 线 放 进 内 存 ，CPU 用 一 个 两 输入 复 用 器 来 进行 选择 ， 实 现 这 个 功能 。 选 择 线 
来 自 寄存 器 r+ 字段 ,输入 来 自 A 和 X 寄存 器 ,输出 将 会 到 达 总 线 。 


10.4.3 二进制 译 码 器 


译 码 器 (decoder) 以 一 个 二 进 制 数字 作为 输入 ， 把 几 条 数据 输出 线 中 的 一 个 设置 为 1， 
其 余 的 设置 为 0， 而 哪 条 数据 线 设 为 1 取决 于 输入 二 进 制 数字 的 值 。 

图 10-45a 展示 的 是 一 个 2x4 二 进 制 译 码 器 的 框图 。S1 和 SO0 是 两 位 数字 输入 ， 
DO ~ D3 是 四 个 输出 ， 其 中 之 一 将 会 为 1; 图 10-45b 是 真 值 表 。 


D3 
S1 
SO 








a) 框图 hE 


图 10-45 2x4 的 二 进 制 译 码 器 

因为 n 位 数字 会 有 2" 个 值 ， 所 以 译 码 器 数据 输出 a> a 
的 数量 是 2 AE. FA 10-46 展示 的 是 一 个 2x4 译 码 器 So’ 
的 实现 。 其 他 可 能 的 大 小 是 3x8 和 4x16。 

一 些 译 码 器 带 有 使 能 输入 。 图 10-47 是 一 个 带 使 能 |} DI 
输入 的 2x4 译 码 器 。 当 使 能 线 为 1 时， 设备 像 图 10-45b 
那样 正常 运行 。 当 使 能 线 为 0 时， 所 有 输出 为 0。 实现 s1 
带 使 能 功能 的 译 码 器 要 求 每 个 AND 门 有 一 个 附加 的 输 8 |} a 
入 ， 细 节 情 况 作为 章 未 的 一 道 练习 。 

Pep/9 的 CPU 中 有 应 用 译 码 器 的 一 个 例子 。 一 些 |} P 
指令 有 一 个 三 位 的 寻 址 aaa 字段 ， 这 个 字段 指定 八 种 寻 S0 


址 方式 之 一 。 硬 件 有 八 个 地 址 计算 单元 ， 每 个 方式 对 图 10-46 2x4 二进制 译 码 器 的 实现 
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应 一 个 。 每 个 单元 有 一 条 使 能 线 。 三 条 aaa 地 址 线 输 入 到 一 个 3 x 8 译 码 器 ， 该 译 码 器 的 每 
条 输出 线 将 会 使 能 八 个 地 址 计算 单元 中 的 一 个 。 


10.4.4 多 路 分 配器 si —> ”> 
复 用 器 是 把 几 个 数据 输入 值 中 的 一 个 发 送 到 唯一 的 输出 so —> D2 


线 ， 多 路 分 配器 ( demultiplexer) 正好 相反 ， 它 把 唯一 的 输入 4 
值 发 送 到 几 条 输出 线 之 一 。 


使 能 线 
图 10-48a 是 一 个 四 输出 多 路 分 配器 的 框图 ， 图 10-48b 
’ 图 10-4 A x 
是 它 的 真 值 表 。 如 果 S1 和 S0 为 01， 那 么 除 D1 之 外 的 所 有 0 eer 


输出 线 都 是 0，D1 的 值 和 数据 输入 线 的 值 一 致 。 


me 7 Fa i 
Pee A Se, TOREA VE y y 





DO boa | I eee ee T= ee. 
D1 
D2 
D3 


Si SO Er r 
a) 框图 b) 真 值 表 
图 10-48 ”四 路 输出 的 多 路 分 配器 


这 个 真 值 表 类 似 于 图 10-45b 的 译 码 器 的 真 值 表 。 多 路 分 配器 实际 上 就 是 一 个 带 使 能 功 
能 的 译 码 器 ， 数 据 输入 线 D 和 使 能 线 相连 接 。 如 果 DD 为 0 则 译 码 器 被 禁用 ，S1 和 SO 选择 
的 数据 输出 线 为 0 ; 如 果 D 为 1， 译 码 器 使 能 ， 选 择 的 数据 输出 线 为 1。 在 这 两 种 情况 中 ， 
选择 的 输出 线 与 数据 输入 线 的 值 都 一 样 。 这 又 是 一 个 用 不 同 的 视角 来 思考 组 合 设备 得 到 一 种 
非常 有 用 的 运算 的 例子 。 


10.4.5 “加 法 器 


思考 下 面 的 二 进 制 加 法 
1011 


ADD 0011 
c=0 1110 
V=0 


最 低 有 效 位 (LSB) 的 和 是 1 加 上 1 等 于 0， 有 一 个 1 进位 到 下 一 列 。 要 将 两 个 数 的 最 
低 有 效 位 相 加 需要 如 图 10-49a 所 示 的 半 加 器 (half adder)。 在 图 10-49 中 ，A 代表 第 一 个 数 
的 LSB,B 代表 第 二 个 数 的 LSB。 本 例 中 ， 一 个 输出 是 Sum (和 )0， 另 一 个 输出 是 Carry (itt 
fii) 1。 图 10-49b 是 真 值 表 。Sum 和 XOR 函数 一 样 ，Carry 和 AND 函数 一 样 。 图 10-49c 部 
分 是 最 直观 的 实现 。 

要 得 出 LSB 相 邻 列 的 和 就 需要 一 个 有 三 个 输入 的 组 合 电路 : Cin、A 和 B，Cin 是 来 自 
F LSB 的 进位 输入 , A 和 B 是 第 一 个 数 和 第 二 个 数 的 位 ， 输 出 是 Sum 和 Cout, Cout 会 送 到 
下 一 列 的 全 加 器 的 Cin, Fl 10-50a 是 这 个 线路 的 框图 ， 称 为 全 加 器 ( full adder)。 图 10-50b 
是 它 的 真 值 表 ， 如 果 三 个 输入 的 和 是 奇数 ， 则 Sum 为 1; 如 果 三 个 输入 的 和 大 于 1， 则 Cout 
#1. 
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A B 
A B Carry 
1 0 1 0 
Sum 
3 Sum 
a) 框图 b) 真 值 表 c) 实现 
图 10-49 半 加 器 


图 10-51 展示 的 是 一 个 全 加 器 的 实现 ， 使 用 了 两 个 半 加 器 和 一 个 OR 门 。 第 一 个 半 加 器 
将 A 和 B 相 加 ， 第 二 个 半 加 器 将 第 一 个 半 加 器 的 和 与 Cin 相 加 ， 全 加 器 的 和 是 第 二 个 半 加 
器 的 和 。 如 果 第 一 个 或 第 二 个 半 加 器 有 进位 ， 则 全 加 器 就 有 进位 。 























0 0 0|0 0 

AB 0 o rji 0 

| | 0 1 0|1 0 

| 

| 

Sum a, 

a) 框图 b ) 真 值 表 

图 10-50 全 加 器 图 10-51 用 两 个 半 加 器 实现 一 个 全 加 器 


要 将 两 个 4 位 数字 相 加 就 需要 一 个 八 输入 电路 ， 如 图 10-52a 所 示 。A3 A2 Al A0 是 第 一 
个 数字 的 4 位 ，A0 是 LSB，B3 ~ BO 是 第 二 个 数字 的 4 位 ，S3 S2 S1 S0 是 4 位 的 和 ，Cout 
是 进位 位 。 实 现 4 位 加 法 器 可 以 使 用 一 个 用 于 LSB 的 半 加 器 和 三 个 全 加 器 ， 剩 下 的 每 列 一 
个 全 加 器 。 因 为 从 LSB 开始 的 进位 要 像 波 浪 一 样 向 左边 的 列传 递 ， 所 以 这 个 实现 称 为 行 波 
进位 加 法 器 (ripple-carry adder)。 图 10-52b 给 出 的 就 是 这 样 的 实现 。 

行 波 进 位 加 法 器 的 进位 是 最 左边 的 全 加 器 的 Cout。 如 果 把 整数 当 作 无 符号 数 ， 这 个 进 
位 位 就 表明 是 否 发 生 溢 出 。 如 果 把 整数 当 作 二 进 制 补 码 表示 的 有 符号 数 ， 最 左边 的 位 是 符号 
位 ， 和 它 相 邻 的 是 数值 最 大 的 最 高 有 效 位 。 因 此 对 于 有 符号 数 ， 倒 数 第 二 个 全 加 器 的 Cout 
信号 (本 例 中 的 S2) 是 进位 位 。 

V 位 表示 把 数字 看 成 有 符号 数 时 是 否 发 生 溢出 。 遇 到 下 面 两 种 情形 之 一 时 才 可 能 发 生 
溢出 : 

。 A 和 B 都 是 正 数 ， 结 果 是 负数 。 

o A 和 B 都 是 负数 ,结果 是 正 数 。 
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A3 A2 Al AO B3 B2 Bl1 BO 


yyy vr 


$3 52 S1 SO 
a) 框图 


A3 B3 | i 
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BO 
' ifs t e 
i cx c Cin 


b) 实现 
图 10-52 ”四 位 行 波 进位 加 法 器 


将 两 个 符号 不 同 的 整数 相 加 不 会 发 生 溢 出 。 第 一 种 情况 中 A3 和 B3 都 是 0， 在 倒数 第 
二 个 全 加 器 一 定 会 有 进位 ， 这 个 进位 将 S3 置 为 1， 最 左边 的 全 加 器 的 Cout 为 0。 第 二 种 情 
况 中 A3 和 了 B3 都 是 1， 最 左边 的 全 加 器 一 定 有 一 个 进位 ， 倒 数 第 二 个 全 加 器 不 会 有 进位 ， 
因为 S3 一 定 是 0。 在 这 两 种 情况 中 ， 最 左边 全 加 器 的 进位 不 同 于 倒数 第 二 个 全 加 器 的 进位 ， 
但 这 正好 是 XOR 函数 。 只 有 当 它 的 两 个 输入 不 同时 ， 它 才 为 1。 因 此 可 以 用 XOR 门 来 计算 
V 位 ， 两 个 输入 来 自 最 左 和 倒数 第 二 个 全 加 器 的 Cout 信和 号。 

行 波 进位 加 法 器 最 主要 的 缺点 是 进位 必须 传递 经 过 所 有 全 加 器 才能 在 输出 产生 有 效 的 结 
果 。 由 于 加 法 是 非常 基础 的 数学 运算 ， 因 此 加 法 器 电路 得 到 了 广泛 研究 。 先 行进 位 加 法 器 通 
过 在 设计 中 加 入 一 个 先行 进位 单元 ， 解 决 了 行 波 进 位 加 法 器 的 速度 劣势 。 更 复杂 的 加 法 器 超 
出 了 本 书 的 讲述 范围 。 


10.4.6 ”加 法 器 /减法 器 


要 用 A 减 B， 可 以 按照 加 法 器 的 思路 设计 一 个 减法 器 电路 ， 只 不 过 相应 于 加 法 的 进位 机 
制 ， 它 要 有 借 位 机 制 。 不 过 ， 其 实 不 需要 构造 一 个 独立 的 减法 电路 ,把 B 取 反 后 再 和 A 相 
加 更 简单 一 些 。 回 想 一 下 第 3 章 的 二 进 制 补 码 规则 : 

NEGx=1+NOTx 

对 一 个 数 取 反 时 ， 要 把 这 个 数 的 所 有 位 取 反 ， 然 后 加 1。 因 此 ， 要 构建 一 个 既是 加 法 器 
又 是 减法 器 的 电路 ， 需 要 通过 一 种 方法 有 选择 地 反 转 B 的 所 有 位 ， 还 需要 通过 一 种 方法 有 
选择 地 将 它 加 1。 幸 运 的 是 XOR 门 能 够 实现 这 个 功能 ， 因 为 可 以 把 XOR 门 当 作 一 个 选择 反 
HABE o 

图 10-53 展示 的 是 一 个 基于 这 个 思路 的 加 法 器 /减法 器 电路 。 图 10-53a 中 的 框图 和 行 波 
进位 加 法 器 框图 相 比 ， 只 是 多 了 一 个 标识 为 Sub 的 控制 线 。 当 Sub=0 时 ， 电 路 作为 一 个 加 
法 器 ， 当 Sub=1 时 ， 这 个 电路 是 个 减法 器 。 

图 10-53b 是 这 个 电路 的 实现 。 对 于 加 法 器 电路 ，LSB 的 运算 只 需要 一 个 半 加 器 ， 加 法 
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器 /减法 器 用 一 个 全 加 器 代替 它 。 考 虑 Sub=0 的 情况 ， 这 样 LSB 的 全 加 器 的 Cin 为 0， 就 像 
是 一 个 半 加 器 。 而 且 ， 对 于 上 面 四 个 XOR 门 ， 每 个 门 的 左边 的 输入 也 是 0， 它 使 得 B 信号 
毫 无 改变 地 通过 这 些 门 。 该 电路 计算 A 和 了 B 的 和 。 


Pi FELI 


Cout 
~<— Sub 


63 S2 S1 SO 
a) 框图 
A3 B3 A2 B2 Al Bl AO BO 
$3 S2 


A B A B 
Cout Cin Cout Cin 
S S 
S1 So 
b) 实现 


图 10-53 ”四 位 行 波 进位 加 法 器 /减法 器 


现在 来 考虑 Sub=1 的 情况 ， 由 于 上 面 四 个 XOR 门 左 边 的 输入 都 是 1， 因此 B 的 所 有 位 
WR. WA, 最 低 有 效 位 的 全 加 器 的 Cin 是 1， 将 结果 加 1。 因 此 这 个 和 是 A 加 上 B 的 反 
的 和 。 


10.4.7 算术 逻辑 单元 


Pep/9 的 处 理 指 令 包 括 ADDr、ANDr 和 ORr。 
加 法 是 算术 运算 ， 然 而 AND 和 OR 是 逻辑 运算 。 A B 
CPU 通常 包括 一 个 简单 的 组 合 电路 ， 称 为 算术 逻辑 
单元 (Arithmetic Logic Unit，ALU)， 它 会 执行 这 些 
运算 。 qm ALU 

图 10-54 展示 的 是 Pep/9 CPU 的 ALU。 线 上 有 — Cin 
一 条 小 斜 线 代表 多 于 1 个 的 控制 线 ， 斜 线 旁 边 的 数 
字 指 明 控 制 线 的 数量 ,标记 为 ALU 的 线 代表 四 条 






Result 


R, ALU 总 共有 21 条 输入 线 : A 输入 8 条 线 , B oo 
输入 8 KA, 4 条 线 用 于 指定 ALU 执行 的 功能 ， 还 N 


有 一 条 Cin 线 。 它 有 12 条 输出 线 : Result 8 条 线 ， 图 10-54 Pep/9 ALU 的 框图 


617 
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此 外 还 有 4 条 线 对 应 Result 的 NZVC 值 。 进 位 输出 线 标记 为 Cout， 区 别 于 进位 输入 线 Cin. 
零 输出 线 标识 为 Zout， 区 别 于 CPU 中 另 一 个 Z， 这 个 Z 将 在 第 12 章 中 讲述 。 

4 条 ALU 控制 线 指 定 ALU 将 执行 16 种 功能 中 的 哪 一 个 。 图 10-55 列 出 了 这 16 种 功 
能 ， 其 中 大 多 数 直 接 对 应 Pep/8 指令 集中 的 运算 。 因 为 “+” 符 号 通常 用 作 人 逻辑 OR 运算 ， 
所 以 算术 运算 写成 “plus” 和 “minus”。 图 中 列 出 了 每 种 运算 对 应 的 NZVC 位 的 值 。 上 横 
线 是 取 反 的 另 一 种 表示 法 ， 比 如 ，NAND 的 A.B 就 等 同 于 (A:B)'。 











o g 


0000 0 A 


N Z 0 
0001 l A 加 B N Z V C 
0010 2 A 加 B 加 Cin N Z y C 
N Z V C 





A 加 B 加 1 


1000 8 A+B N 

1001 9 A@B N Z 0 0 

1010 10 A N Z 0 0 
N 





图 10-55 Pep/9 ALU 的 16 种 功能 


图 10-56 展示 的 是 ALU 的 实现 。 可 以 看 到 从 上 面 和 右边 进来 的 21 条 输入 线 和 底部 出 
来 的 12 条 输出 线 。 从 右边 来 的 4 条 ALU 线 驱 动 一 个 4x 16 译 码 器 。 来 回忆 一 下 根据 ALU 
输入 值 的 情况 ， 译 码 器 输出 线 中 的 一 条 将 会 为 1， 其 余 的 都 为 0。ALU 中 的 计算 单元 执行 
图 10-55 中 的 前 15 种 功能 ， 从 译 码 器 来 的 进入 计算 单元 的 15 条 输入 线 ， 其 中 的 每 一 条 都 使 
能 一 个 执行 对 应 功能 的 组 合 电路 。 

该 计算 单元 有 32 条 输入 线 : A 输 入 8 条 ,，B 输 入 8 条 ，cCin 一 条 , 来 自 译 码 器 的 15 条 。 
CA 10 条 输出 线 : 计算 结果 8 条 , 加 上 V 和 C 各 一 条 。N 和 Z 位 的 计算 在 计算 单元 之 外 。 
在 图 10-56 中 可 以 看 到 NN 位 只 是 计算 单元 Result 最 高 位 的 一 个 副本 ，Z 位 是 Result 的 8 个 
位 的 NOR。 如 果 所 有 8 个 位 都 是 0， 那 么 NOR 门 的 输出 为 1 ; 如 果 其 中 之 一 或 者 更 多 的 输 
入 位 为 1， 那么 NOR 门 的 输出 为 0， 这 正好 是 根据 计算 结果 设置 Z 位 的 条 件 。 

左下 的 方 框 是 一 组 12 个 双 输 入 的 复 用 器 ， 每 个 复 用 器 的 控制 线 连接 到 译 码 器 的 第 15 号 
线 。 这 个 控制 线 的 功能 如 下 : 
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e MRA 15 为 1， 则 从 左边 来 的 Result 和 NZVC 被 送 到 输出 。 
e 如果 线 15 为 0， 则 从 右边 来 的 Result 和 NZVC 被 送 到 输出 。 









Result 


Result 


12 双 输 入 复 用 器 


Result N Zout 





Al 10-56 图 10-54 中 ALU 的 实现 


来 看 看 图 10-56 如 何 计算 图 10-55 的 最 后 一 个 功能 。 如 果 ALU 输入 是 1111 (bin), 那么 
线 15 为 1， 从 左边 来 的 Result 和 NZVC 被 送 到 ALU 的 输出 。 但 是 在 图 10-56 中 可 以 看 到 
Result 左边 的 位 连接 到 0，NZVC 来 自 A 的 低 四 位 元 组 〈 半 字 节 )， 这 正 是 该 功能 要 求 的 。 

图 10-57 是 图 10-56 计算 单元 的 实现 。 它 由 一 个 A 单元 、 一 个 算术 单元 和 标号 为 逻辑 单 
元 5 到 逻辑 单元 14 的 10 个 逻辑 单元 组 成 。A 单元 和 每 个 逻辑 单元 都 由 译 码 器 的 15 条 线 之 
一 来 使 能 。 任 何 单元 的 使 能 线 E 如 果 为 0， 那么 不 管 这 个 单元 的 其 他 输入 是 什么 ，Result、 
V 和 C 的 所 有 位 都 是 0。 算 术 单 元 负责 图 10-55 中 功能 1、2、3 和 4 对 应 的 算术 运算 的 
Result、V 和 C 的 计算 ， 算 术 单 元 相应 的 控制 线 的 标识 分 别 为 4、e、f 和 g。 如 果 d、e、f 和 
g 四 个 都 为 0， 那 么 不 管 算术 单元 的 其 他 输入 是 什么 ，Result、V 和 C 的 所 有 位 都 为 0。 

计算 单元 的 每 个 输出 都 连接 到 一 个 12 输入 的 OR 门 。 此 OR 门 的 其 他 11 个 输入 是 其 他 
11 个 计算 单元 对 应 的 输出 线 。 例 如 ， 所 有 12 个 计算 单元 的 V 输出 送 到 一 个 OR 门 。 因 为 11 
个 计算 单元 都 一 定 是 未 使 能 的 ， 确 切 地 说 每 个 OR 门 的 11 个 输入 都 一 定 为 0， 所 以 不 一 定 为 
0 的 输入 来 自 于 被 使 能 的 单元 。 因 为 0 是 OR 运算 的 零 元 

p OR 0=p 
所 以 被 使 能 单元 的 输出 会 不 改变 地 通过 OR 门 。 
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10 12 输入 OR 门 





8 
Result V C 


图 10-57 图 10-56 中 计算 单元 的 实现 


图 10-58 A 单元 的 实现 。 它 由 8 个 两 输入 AND 门 组 成 ， 这 些 门 是 8 位 A 信号 的 使 能 
门 。 图 10-55 表明 V 和 C 应 该 为 0， 因 此 V 和 C 输 出 线 在 这 个 实现 中 都 是 0。 





Result 


图 10-58 图 10-57 中 A 单元 的 实现 


图 10-59 是 算术 单元 的 一 种 实现 ， 它 是 图 10-53 的 加 法 器 /减法 器 电路 的 一 个 扩展 ， 修 
改 后 能 够 处 理 两 种 额外 情况 : 用 两 个 8 位 运算 来 实现 16 位 值 的 加 减 。 图 10-60 展示 的 是 怎 
样 用 两 个 8 位 运算 来 做 16 位 运算 。 图 10-60a 中 ，16 位 加 法 是 这 样 的 : 对 A 和 B 的 低 字 节 
执行 
AplusB 
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然后 对 高 字 节 执行 
Aplus B plus Cin 
这 里 的 Cin 是 低 字 节 运 算 的 Cout。 图 10-60b 中 ，16 位 减法 是 这 样 的 : 对 A 和 B 的 低 字 节 
执行 
A plus B plus 1 
然后 对 高 字 节 执 行 
Aplus B plus Cin 
这 里 的 Cin 同样 是 低 字 节 运算 的 Cout。 最 后 这 个 运算 同样 是 依据 在 硬件 上 实现 A 减 B 
就 是 把 A 加 上 B 的 补 。 低 字 节 运算 的 进位 是 加 法 的 进位 而 不 是 减法 的 ， 这 也 是 为 什么 电路 
要 加 上 而 不 是 减 去 低 字 节 运算 的 Cin 的 原因 。 


A7 B7 A6 B6 


Cin 


a 


09 Oo 





Result 


图 10-59 图 10-57 中 算数 单元 的 实现 


A<high> B<high> A<low> B<low> A<high> B<high> A<low> B<low> 


en y YV O y yO y 





S<high> S<low> D<high> D<low> 
a) 16 位 加 法 b ) 16 位 减法 


图 10-60 用 两 个 8 位 运算 来 实现 16 位 运算 
5 下 面 讲解 硬件 怎样 处 理 259-261. 259 (dec) 作为 一 个 16 位 数 ， 其 表示 为 
0000 0001 0000 0011， 因 此 A<high>=0000 0001，A<low>= 0000 0011。261 (dec) 作为 一 个 
16 位 数 ， 其 表示 为 0000 0001 0000 0101， 因 此 B<high>=0000 0001，B<low>= 0000 0101。 
低 字 节 相 加 是 
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0000 0011 
1111 1010 
ADD 1 
C=0 1111 1110 
高 字 节 相 加 是 
0000 0001 
1111 1110 
ADD 0 
C=0 1111 1111 


V=0 
最 终 的 差 是 1111 1111 1111 1110 (bin) = -2 ( dec)， 和 预期 的 一 样 。 最 终 的 V 位 由 最 后 
的 进位 和 倒数 第 二 个 进位 进行 异 或 计算 得 出 ， 结 果 如 下 : 
0 ® 0=0 
下 面 讲解 硬件 怎样 处 理 261-259。 这 次 ，A<high>=0000 0001, A<low>= 
0000 0101, B<high>=0000 0001, B<low>= 0000 0011。 低 字 节 相 加 是 


0000 0101 
1111 1100 
ADD 1 
C=1 0000 0010 
高 字 节 相 加 是 
0000 0001 
1111 1110 
ADD 1 
C=1 0000 0000 


V=0 
最 终 的 差 是 0000 0000 0000 0010 (bin) = 2 ( dec)， 和 预期 的 一 样 。 最 终 的 V 位 由 最 后 
的 进位 和 倒数 第 二 个 进位 进行 异 或 计算 得 出 ， 结 果 如 下 : 
1@ 1=0 m 
图 10-59 右上 部 分 的 控制 电路 框 控制 该 电路 的 功能 ， 图 10-61 是 它 的 真 值 表 。 将 这 个 框 
和 图 10-53 中 控制 加 法 器 /减法 器 电路 的 Sub 线 进行 比较 ， 当 加 法 器 /减法 器 中 的 Sub 为 0 
时 ，B 不 会 被 XOR 门 反 转 ， 低 字 节 位 计算 的 进位 是 0; 当 Sub 为 1 时 ，B 被 反 转 ， 低 字 节 
位 计算 的 进位 是 1。 这 两 个 功能 对 图 10-61 的 第 一 和 第 三 行 都 是 成 立 的 ， 第 二 行 用 于 高 字 节 
相 加 ， 最 后 一 行 用 于 高 字 节 相 减 。 
从 理论 上 来 讲 ， 控 制 框 的 输出 Sub 和 C 
是 d、e、f、g 和 Cin 的 函数 ， 然 而 通过 观察 

































真 值 表 可 以 看 到 Sub 可 以 表达 为 Ro ac | EoD A ae, 
Sub=f + g L PE 
C 可 以 表达 为 A plus B plus 1 0 0 1 0 1 1 
C= (Cin+ f) +d’ Se TEL 


两 个 表达 都 和 e 无 关 。 图 10-61 图 10-59 中 控制 电路 的 真 值 表 
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算术 单元 的 另 一 个 要 求 是 如 果 d、e、f 和 8g 都 为 0， 那 么 不 管 其 他 输入 是 什么 ， 所 有 输 
出 一 定 为 0。 图 10-59 中 四 输入 OR 门 的 输出 作为 使 能 信号 ， 当 d、e、f 和 8g 之 一 为 1 时 ， 
它 人 允许 该 单元 的 所 有 10 个 输出 通过 。 
同样 ，16 位 加 法 可 以 由 先进 行 低 字 节 的 8 位 加 法 再 进行 高 字 节 的 8 位 加 法 来 实现 ， 移 
位 和 循环 移 位 运算 也 可 以 由 两 个 8 位 运算 组 成 。 图 10-62 展示 了 图 10-55 中 Pep/9 ALU 的 移 
位 和 循环 位 移 和 运算。 虽然 图 10-62 中 没有 显示 ， 但 是 ROL (循环 左 移 ) 和 ASL (算术 左 移 ) 
运算 都 要 设置 V 位 。 
10-62a 和 图 10-62b 展示 了 16 位 算术 右 移 的 运算 。 首 先是 高 字 节 的 8 位 算术 右 移 ， 
这 个 移 位 运算 复制 符号 位 ， 并 把 高 字 节 的 低位 移入 Cout。 然 后 是 低 字 节 的 循环 右 移 操作 ， 
这 个 操作 把 高 字 节 移 位 的 Cout 作为 自己 的 Cin， 并 把 低位 循环 移入 Cout, 


[LETTE TT Od 


WEEE | 


Cout Cout 
a) RAAB (ASR) b) 循环 右 移 (ROR ) 
Cin 
Cout Cout 
c) 循环 左 移 (ROL) d) 算术 左 移 ( ASL ) 


图 10-62 移 位 和 循环 移 位 运算 规范 


图 10-62c 和 图 10-62d 展示 了 16 位 算术 左 移 运 算是 从 图 10-62d 中 低 字 节 算 术 左 移 开 始 
的 。Cout 得 到 最 高 有 效 位 ， 在 随后 的 高 字 节 循环 右 移 中 用 作 Cin (图 10-62c)。 第 二 步 说 明 
在 ROL 运算 时 ， 为 什么 ALU 要 设置 V 位。 图 5-2 显示 在 Asmb5 层 上 ROLr 指令 不 影响 V [625 
位 。 但是， 在 LG1 这 个 更 低 的 抽象 层 上 ALU 要 设置 V 位 ,原因 是 这 个 层次 的 ROL 功能 被 
用 于 实现 更 高 层次 上 的 ASLr 指令 。 

逻辑 单元 5 一 14 的 实现 留 作 练习 。 因 为 普通 逻辑 门 就 能 实现 逻辑 运算 ， 所 以 它们 的 实 
现 很 简单 。 


10.4.8 LG1 层 的 抽象 


抽象 数据 类 型 ( ADT) 是 HOL6 层 的 一 个 重要 设计 工具 。 其 思想 是 了 解 对 ADT 进行 操 
作 的 函数 和 过 程 是 做 什么 的 ， 从 而 理解 ADT 的 行为 ， 而 不 必 知 道 它们 是 怎样 做 的 。 一 旦 实 
现 了 一 种 操作 ， 可 以 不 理会 实现 细节 而 专注 于 解决 更 高 抽象 层次 上 的 问题 。 

相同 的 原理 在 硬件 层 上 也 适用 。 本 节 中 的 每 个 组 合 设备 都 有 框图 和 真 值 表 来 描述 它们 的 
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功能 。 框 图 之 于 硬件 就 像 ADT 之 于 软件 ， 它 是 一 种 抽象 ， 指 定 输入 和 输出 而 隐藏 实现 细节 。 

硬件 中 更 高 层次 的 抽象 可 以 通过 构建 框图 定义 的 设备 获得 ， 这 些 框图 的 实现 是 更 低 抽 
象 层 次 框图 的 互联 。 图 10-50 是 个 完美 的 例子 ， 这 个 全 加 器 模块 用 图 10-51 的 半 加 器 模块 来 
实现 。 

硬件 的 最 高 抽象 层次 是 我 们 反复 看 到 的 Pep/9 计算 机 的 框图 。 它 有 三 个 模块 : 磁盘 、 
CPU 以 及 带 内 存 映 射 的 IO 设备 的 主 存 ， 它 们 之 间 用 总 线 相连 。 在 稍 低 的 抽象 层次 ， 我 们 可 
以 看 到 CPU 中 的 寄存 器 ， 每 个 寄存 器 被 描绘 成 一 个 模块 。 后 面 两 章 将 逐步 扩展 到 更 高 的 抽 
象 层次 ， 直 到 ISA3 层 的 Pep/9 计算 机 。 


本 章 小 结 

在 组 合 电路 中 ， 输 入 决定 输出 。 组 合 电路 的 三 种 表示 方式 是 真 值 表 、 布 尔 代 数 表 达 式 和 
逻辑 图 。 这 三 种 表示 方式 中 ， 真 值 表 位 于 最 高 抽象 层次 ， 它 们 指定 电路 的 功能 而 不 指定 电路 
的 实现 。 真 值 表 列 出 了 输入 所 有 可 能 组 合 的 输出 ， 因 此 称 为 组 合 电路 。 

626 布尔 代数 的 三 种 基本 运算 是 AND、OR 和 NOT。 布尔 代数 的 10 个 基本 属性 包括 5 个 定 
律 ， 交 换 律 、 结 合 律 、 分 配 律 、 恒 等 律 和 互补 律 以 及 它们 的 对 偶 属 性 ， 根 据 它们 可 以 证 明 出 
很 有 用 的 布尔 定理 。 另 一 个 重要 的 定理 是 德 ， 摩根 定律 ， 它 展示 了 怎样 对 几 个 项 的 AND 或 
OR 进行 NOT。 

一 个 布尔 表达 式 对 应 一 个 逻辑 图 ， 你 辑 图 又 对 应 电子 门 的 连接 。 三 个 常见 的 门 是 NAND 
( AND Ja MIR NOT), NOR (OR 后 面 跟 NOT) 和 XOR (exclusive OR)。 两 级 电路 可 以 将 
处 理 时 间 减 到 最 少 , 但 是 可 能 比 等 价 的 多 级 电路 需要 更 多 的 门 。 这 是 又 一 个 重要 的 空间 / 
时 间 折 中 的 例证 。 卡 诺 图 可 以 帮助 减少 实现 两 级 组 合 电 路 的 门 的 数量 。 

组 合 设备 包括 复 用 器 、 译 码 器 、 多 路 分 配器 、 加 法 器 和 算术 逻辑 单元 (ALU)。 复 用 器 
从 几 个 数据 输入 中 选择 一 个 传送 到 唯一 的 数据 输出 。 译 码 器 将 一 个 二 进 制 数 作为 输入 ， 将 几 
个 数据 输出 线 中 的 一 个 设 为 1， 其 余 的 设 为 0。 多 路 分 配器 把 几 个 数据 输入 值 中 的 一 个 传送 
到 唯一 的 输出 线 ， 逻 辑 上 等 同 于 一 个 有 使 能 线 的 译 码 器 。 半 加 器 实现 的 是 两 个 位 的 相 加 ， 全 
加 器 是 三 位 相 加 ， 其 中 一 个 是 前 一 位 相 加 的 进位 。 减 法 器 的 工作 原理 是 对 第 二 个 操作 数 取 
反 ， 然 后 和 第 一 个 操作 数 相 加 。ALU 执行 算术 和 逻辑 功能 。 


练习 
10.1 节 
1. * (a) 用 布尔 代数 证 明 零 元 定理 x+ 1=1， 给 出 证 明 中 每 一 步 的 解释 。 提 示 : 用 互补 性 来 扩展 左边 的 
1， 然 后 使 用 适 等 性 。 
(b) 给 出 (a) 中 的 对 偶 证 明 。 
2. (a) 用 布尔 代数 证 明 吸 收 律 x+x y=x*， 给 出 证 明 中 每 一 步 的 解释 。 
(b) 给 出 (a) 中 的 对 偶 证 明 。 
3. (a) 用 布尔 代数 证 明 合 意 定 理 x :y+x'* z+y'z=x* y+x'* z， 给 出 证 明 中 每 一 步 的 解释 。 
(b) 给 出 (a) 中 的 对 偶 证 明 。 
*4. 用 书 中 证 明 的 对 偶 来 证 明 德 ， 摩根 定律 (a + b) '= a'* b'， 给 出 证 明 中 每 一 步 的 解释 。 
5. (a) 根据 两 个 变量 的 德 * 摩根 定律 使 用 数学 归纳 法 证 明 德 . 摩根 定律 的 一 般 形式 
(a, aa + + a) =a +a t+ a,’ HH n > 2 


(b) 给 出 (a) 中 的 对 偶 证 明 。 
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6. (a) 用 布尔 代数 证 明 (x+y). (x'+y) =y， 给 出 证 明 中 每 一 步 的 解释 。 
(b) 给 出 (a) 中 的 对 偶 证 明 。 
7. (a) 用 布尔 代数 证 明 (Cx ty) (ys xD =x+y， 给 出 证 明 中 每 一 步 的 解释 。 
(b) 给 出 (a) 中 的 对 偶 证 明 。 
8. * (a) 画 出 一 个 三 输入 OR 门 ， 它 的 布尔 表达 式 和 真 值 表 如 图 10-10 所 示 。 
(b) 用 三 输入 NAND 门 来 实现 (a) 中 的 要 求 。 
(c) 用 三 输入 NOR 门 来 实现 (a) 中 的 要 求 。 
9. 用 集合 论 来 解释 下 面 的 布尔 属性 或 定理 : 
*(a)x+0 =x (b)x* 1 =x (e)xw+x'= 1 (d)x * x'=i0 
(e)xX* X=x (f)xtx=x (g)x-0=0 
10. *(a) 用 x、y 和 z MBB RY CRU OR 运算 的 结合 律 。 画 出 下 面 的 区 域 来 表明 区 域 (3 ) 
和 区 域 (6 ) 是 一 样 的 : 
(1) @ty) (2)2 (3) ~t+y)+z 
(4) x (5) (y+x) (6) x+(y+z) 
(b) 给 出 (a) 中 的 对 偶 。 
11.(a) 用 x*、7 和 = 的 重 释 区域 的 文 氏 图 来 说 明 分 配 律 。 画 出 下 面 的 区 域 来 表明 区 域 (3 ) 和 区 域 (6 ) 


是 一 样 的 : 
(1)x (2) yez (3) x+yez 
(4 )(x+y) (5) (+z) (6) (x+y) + (x +z) 


(b) 给 出 (a) 中 的 对 偶 。 
12. (a) 用 a 和 4 的 重合 区 域 的 文 氏 图 来 说 明 德 * 摩根 定律 。 画 出 下 面 的 区 域 来 表明 区 域 (2 ) 和 区 域 
(5) 是 一 样 的 : 
(1)a'b (2) (a+ by’ (3) a’ (4) b! (5) a'+b' 
(b) 给 出 (a) 中 的 对 偶 。 

13. 虽然 组 合 电路 的 一 个 布尔 变量 只 能 取 两 个 值 1 或 0, 但 是 布尔 代数 可 以 描述 变量 有 四 种 可 能 取 值 的 
系统 ， 这 四 种 可 能 的 取 值 是 : 0、1、A 和 B。 这 样 的 系统 对 应 于 {a,b} 的 子 集 的 描述 : 1={a, b} (全 
42), A={a}, B={b}, if] 0={} ( 空 集 )。 二 输入 AND 和 OR 运算 的 真 值 表 有 16 个 条 目 而 不 是 4 个 ， 
求 补 的 真 值 表 有 4 个 条 目 而 不 是 2 个 。 构 造 下 述 运算 的 真 值 表 : 

*(a) AND (b) OR (c) 求 补 
14. 异 或 NOR 门 ， 写 作 XNOR， 等 价 于 XOR 后 面 跟 一 个 反 相 器 。 
*(a) 画 出 二 输入 XNOR 门 的 符号 。 
(b) 构造 它 的 真 值 表 。 
(c) XNOR 也 称 作 比较 器 ， 为 什么 ? 


10.2 i 
15. 画 出 下 列 布尔 表达 式 的 非 简略 逻辑 图 。 可 以 使 用 XOR 门 。 
* (a) ((a (b) (((a’)')')' 
* (c) a'b + ab' (d) ab+a'b' 
(e) ab+ab'+a'b (£) ((ab 由 b')'+a'by' 
(g) (a'bc+a)b (h) (ab' c)'(ac)' 
(i) ((ab)'(b'c)'+a'b'c')' G) (aBb+b'@Bc')' 
(k) (abc)'+ (a'b'c')' (1) (a+ b)(a'+ c)(b'+c') 
(m) (a@® b)@c+ab'e (n) (a+ b)'+c)'+d)' 


(0) (ab'+b'et+c)' (p) (a+ b')(b'+ e)(c+d))' 
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(q) (((ab)'c)'d)' (r) (((a ® b)'® c)'@ d)' 
16, 画 出 练习 题 15 中 布尔 表达 式 的 简略 逻辑 图 。 可 以 使 用 XOR 门 。 
17. 构造 练习 题 15 中 布尔 表达 式 的 真 值 表 。 
18. 写 出 图 10-63 中 逮 辑 图 的 布尔 表达 式 。 


a) b) 


c) 
图 10-63 练习 18 的 逻辑 图 


19. 写 出 下 列 功 能 或 门 的 AND-OR 布尔 表达 式 : 
*(a) 图 10-3 中 的 功能 y 
(b) 图 10-4 中 的 功能 y 
(c) 图 10-17 中 的 功能 x 
(d) 图 10-7a 中 的 NAND 门 
(e) 图 10-7c 中 XOR 门 
20. 写 出 下 列 功 能 或 门 的 OR-AND 布尔 表达 式 : 
*(a) 图 10-3 中 的 功能 y 
(b) 图 10-17 中 的 功能 x 
(c) 图 10-7b 中 的 NOR 门 
629 (d) 图 10-7c 中 的 XOR 门 
21. 使 用 布尔 代数 的 属性 和 定理 将 下 述 表 达 式 规约 为 不 带 括号 的 AND-OR 表达 式 。 得 到 的 表达 式 不 一 
定 是 唯一 的 。 根 据 最 终 得 到 的 表达 式 构造 真 值 表 ， 这 是 唯一 的 。 


* (a) (a'b + ab’)! (b) (ab +a'b’) 
(c) (ab + ab'+a'b)' * (d) (ab ® b’)'+ ab 
(e) (a’be+a)b (f) (ab'c)"ac)' 
(g)a®b)@Oe (h) a®(b@e) 
(i) (a+ b)(a'+ c)(b'+ c') (j) (a+ b)'+e)' 


*22. 为 练习 21 中 的 表达 式 构造 两 级 电路 ， 仅 使 用 NAND 门 。 
23. 使 用 布尔 代数 的 属性 和 定理 将 下 述 表达 式 规约 为 不 带 括号 的 OR-AND 表达 式 。 得 到 的 表达 式 不 一 
定 是 唯一 的 。 根 据 最 终 得 到 的 表达 式 构 造 真 值 表 ， 这 是 唯一 的 。 
(a) a'b+ab' * (b)ab+a'b!' 
(c) ab +ab'+a'b (d) ((ab ® b')'+ ab)! 
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(e) (a'be +a) b (f) (ab'c)(ac)' 
(g) (a®b)@™e haabe 
(i) ((a + b)\(a'+ c)(b'+ c'))' (j) (a+b)'+ e 
*24, 为 练习 23 中 的 表达 式 构造 两 级 电路 ， 仅 使 用 NOR 门 。 
25. 画 出 一 个 两 级 电路 的 逻辑 图 ， 实 现 XOR 功能 但 仅 使 用 下 述 门 : 


* (a) 仅 使 用 NAND 门 (b) 仅 使 用 NOR 门 
26. 说 明 图 10-64 中 的 每 个 门 是 不 是 下 面 的 门 : 
(1) AND] (2) OR 门 (3) NAND 门 (4) NOR 门 


a) b) c) d) 
图 10-64 练习 26 的 门 


10.3 # 
*27. 用 西格玛 表示 法 写 出 练习 21 中 的 每 个 功能 。 
*28. 用 派 表示 法 写 出 练习 23 中 的 每 个 功能 。 
29. 在 图 10-3 中 找 出 下 述 最 小 AND-OR 表达 式 : 
* (a) x(a,b,c) (b) y(a,b,c) 
仅 使 用 NAND 门 画 出 每 个 表达 式 的 最 小 两 级 电路 。 
30. 在 图 10-3 中 找 出 下 述 最 小 OR-AND 表达 式 : 
*(a) x(a,b,c) (b) y(a,b,c) 
仅 使 用 NOR 门 画 出 每 个 表达 式 的 最 小 两 级 电路 。 
31. 使 用 卡 诺 图 找 出 x(a, b, c) 的 最 小 AND-OR 表达 式 : 


*(a) 》 (0, 4, 5, 7) (b) ¥ (2, 3, 4, 6, 7) (c) ¥ (0, 3, 5, 6) 
(d) ¥ (0, 1, 2, 3, 4, 6) (e) X (1, 2, 3, 4, 5) (f) ¥ (1, 2, 3, 4, 5, 6, 7) 
(g) ¥ (0, 1, 2, 4, 6) (h) ¥ (1, 4, 6, 7) (i) ¥ (2, 3, 4, 5, 6) 
(j) X (0, 2, 5) 


*32. 用 派 表示 法 写 出 练习 31 中 的 每 个 表达 式 ， 并 用 卡 诺 图 找 出 它 的 最 小 OR-AND 表达 式 。 
33. 使 用 卡 诺 图 找 出 x(a, b, c d) 的 最 小 AND-OR 表达 式 : 
*(a) ¥ (2,3, 4, 5, 10, 12, 13) 
(b) ¥ (1, 5, 6, 7, 9, 12, 13, 15) 
(c) ¥ (0, 1, 2, 4, 6, 8, 10) 
(d) > (7) 
(e) ¥ (2, 4, 5, 11, 13, 15) 
(Ð ¥ (1, 2, 4, 5, 6, 7, 12, 15) 
(g) ©, 2, 4, 5, 6, 7, 8, 11, 12, 15) 
(h) © (1, 7, 10, 12) 
(i) ¥ (0, 2, 3, 4, 5, 6, 8, 10, 11, 13) 
(j) ¥ (0, 1, 2, 3, 4, 5, 6, 10, 11, 13, 14, 15) 
(k) 3 (0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14) 
*34. 用 派 表示 法 写 出 练习 33 中 的 每 个 表达 式 ， 并 用 卡 诺 图 找 出 它 的 最 小 OR-AND 表达 式 。 
35. 使 用 无 关 条 件 用 卡 诺 图 找 出 x(a, b, c) 的 最 小 AND-OR 表达 式 。 
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* (a) ¥ (0, 6) + d(1, 3, 7) (b) ¥ (5) + d(0, 2, 4, 6) 
(c) © (1, 3) + d(0, 2, 4, 6) (d) ¥ (0, 5, 7) + d(3, 4) 
(e) © (1, 7) + d(2, 4) (£) 5 (4, 5, 6) + d(1, 2, 3, 7) 


36. 使 用 无 关 条 件 用 卡 诺 图 找 出 x(a, b, c, d) 的 最 小 AND-OR 表达 式 。 
*(a) Ð (5, 6) + d(2, 7,9, 13, 14, 15) 
(b) ¥ (0, 3, 14) + d(2, 4, 7, 8, 10, 11, 13, 15) 
(c) 5 (3, 4, 5, 10) + d(2, 11, 13, 15) 
(d) 5 (5, 6, 12, 15) + d(0, 4, 10, 14) 
(e) X (1, 6, 9, 12) + d(O, 2, 3, 4, 5, 7, 14, 15) 
(f) ¥ (0, 2, 3, 4) + d(8, 9, 10, 11, 13, 14, 15) 
(g) ¥ (2, 3, 10) + d(0, 4, 6, 7, 8, 9, 12, 14, 15) 
37. (a) 三 变量 的 卡 诺 图 中 最 小 项 0 和 2 相 邻 、 4 和 6 相 邻 。 复制 一 份 图 10-30， 把 卡 诺 图 剪 下 来 并 围 
成 圆柱 状 ， 使 得 相 邻 的 最 小 项 真正 相 邻 。 
(b) 要 想 使 四 变量 卡 诺 图 中 的 相 邻 最 小 项 实际 相 邻 ， 需 要 一 个 三 维 的 圆 环 面 (形状 像 一 个 甜 甜 圈 )。 
用 泥土 或 其 他 合适 的 材料 ， 在 上 面 刻 上 或 写 上 图 10-33a 所 示 的 单元 和 十 进 制 标号 。 例 如 ， 标 
号 为 2 的 单元 应 该 与 标号 0、3、6 和 10 的 单元 相 邻 。 


10.4 节 
38. 把 一 条 线 当 作 数 据 线 ， 男 一 条 当 作 控制 线 ， 解释 下 列 二 输入 门 的 操作 : 
*(a) OR (b) NAND 
(c) NOR (d) XNOR 


XNOR 的 定义 参见 练习 14。 

39. 画 出 八 输入 复 用 器 的 非 简略 逻辑 图 。 

*40. 用 五 个 四 输入 复 用 器 构造 一 个 16 输 入 复 用 器。 把 16 输 入 复 用 器 夯 成 一 个 大 方 框 ， 有 16 条 数据 
线 ， 标号 为 D0 ~ DIS, 还 有 4 条 选择 线 ， 标 号 为 S3 一 S0。 在 这 个 大 方 框 里 ,每 个 四 输入 复 用 器 
是 一 个 小 方 框 ， 数 据 线 为 D0 ~ D3， 选 择 线 S1 和 S0。 画 出 实现 大 复 用 器 需要 的 从 小 方 框 到 外 部 
线路 的 连接 ， 以 及 方 框 之 间 的 连接 。 解 释 你 的 电路 是 如 何 运行 的 。 

41. 用 两 个 不 带 使 能 的 八 输入 复 用 器 以 及 任何 你 需要 的 其 他 门 来 完成 练习 40 的 要 求 。 解 释 你 的 电路 是 
如 何 运 行 的 。 

42.*(a) 画 出 一 个 3x8 二 进 制 译 码 器 的 非 简略 逻辑 图 。 

(b) 画 出 一 个 带 使 能 输入 的 2x4 二 进 制 译 码 器 的 非 简略 逻辑 图 。 

43. 用 五 个 带 使 能 输入 的 2x4 二 进 制 译 码 器 构造 一 个 不 带 使 能 输入 的 4x 16 二 进 制 译 码 器 。 设 备 的 
输入 可 以 是 常数 1。 使 用 练习 40 的 画图 规则 对 外 部 和 内 部 线路 进行 标识 。 解 释 你 的 电路 是 如 何 运 
行 的 。 

44. 用 两 个 带 使 能 输入 的 3 x 8 二 进 制 译 码 器 和 任何 需要 的 其 他 门 构造 一 个 不 带 使 能 输入 的 4x 16 二 进 
制 译 码 器 。 使 用 练习 40 的 画图 规则 对 外 部 和 内 部 线路 进行 标识 。 解 释 你 的 电路 是 如 何 运行 的 。 

45. 实现 一 个 如 图 10-47 所 示 的 带 使 能 输入 的 2 x 4 二 进 制 译 码 器 。 画 出 你 的 电路 的 非 简 略图 。 

46.*(a) 画 出 图 10-51 中 全 加 器 的 实现 ， 给 出 半 加 器 的 AND 和 XOR 门 。 

” *#(b) 从 输入 到 输出 最 大 的 门 延 迟 数 是 多 少 ? 

(c) 根据 图 10-50b 的 真 值 表 ， 设 计 Sum 和 Cout 的 最 小 二 级 网 络 。 
(d) 将 (c) 的 设计 与 (a) 的 设计 进行 比较 ， 计 算 门 的 数量 和 处 理 时 间 的 变化 百分比 。 计 算 结 果 如 
何 说 明 空 间 /时 间 的 折 中 问题 ? 

47.(a) 画 出 图 10-52 的 电路 ， 包 括 半 加 器 的 XOR、AND 和 OR 门 。 

*(b) 从 输入 到 输出 最 大 的 门 延 迟 数 是 多 少 ? 假设 XOR 门 需要 一 个 门 延迟 。 这 个 问题 需要 仔细 思考 。 
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虽然 该 电路 的 进位 是 波浪 式 前 进 的 ， 但 还 是 假设 所 有 八 个 输入 都 同时 出 现 。 

48. 修改 图 10-52b， 增 加 两 个 输出 : N 位 和 2Z 位 。 

49. 实现 一 个 带 选 择 位 S 的 四 位 ASL 移 位 器 ,输入 为 A3 A2 Al A0， 它 代表 一 个 四 位 数 ，A0 Æ LSB, 
A3 是 符号 位 。 则 输出 是 B3 B2 B1 BO 和 进位 位 C。 如 果 S 为 1， 则 输出 是 输入 的 ASL; WR SH 
0， 则 输出 与 输入 一 致 ，C 为 0。 

50. 为 四 位 ASR 移 位 器 完成 练习 49 的 要 求 。 

51. 图 10-65 的 方块 图 是 一 个 三 输入 二 输出 的 组 合 开 关 电 路 。 如 果 s 为 0， 则 输入 a 直接 送 到 x，b 送 到 
y: 如 果 s 是 1， 则 两 者 交换 ，a 送 到 y,b 送 到 x。 只 用 AND、OR 和 反 相 器 门 构造 该 电路 。 


s=0 s= 1 
a x a x 
b y b y 
s s 


图 10-65 练习 51 的 框图 


52. 图 10-66 中 的 框图 是 一 个 四 输入 二 输出 的 组 合 开 关 电 路 。 如 果 sl s0=00, 输入 a 广播 到 x 和 y; 如 
51 s0=01, WA b HRB x Py; WE sl s0=10, Wa hb 直接 通过 到 x 和 y; WE sl s0=11， 
则 a Fil b 交换 ，& 送 到 》，2 送 到 x. AA AND, OR 和 反 相 器 门 构造 该 电路 。 
(a) 使 用 卡 诺 图 构造 最 小 的 AND-OR 电路 。 
(b) 使 用 卡 诺 图 构造 最 小 的 OR-AND 电路 。 


s1 s0=00 sl s0=01 sl s0=10 sl s0=11 


a x a x a x a x 
b y b | y b y 
sl s0 sl s0 sl s0 sl s0 


图 10-66 练习 52 的 框图 


53. 画 出 图 10-56 的 12 个 二 输入 复 用 器 ， 给 出 所 有 输入 到 输出 到 连接 线 。 可 以 用 省 略 号 ( … ) 表示 八 
条 数据 线 中 间 的 六 条 。 
54. 实现 下 面 这 些 Pep/9 ALU 的 逻辑 单元 : 


(a) logic unit 5, A * B (b) logic unit 6, A © B 
(c) logic unit 7, A + B (d) logic unit 8, A+B 
(e) logic unit 9, A ® B (f) logic unit 10, A 

(g) logic unit 11, ASL A (h) logic unit 12, ROL A 
(i) logic unit 13, ASR A (j) logic unit 14, ROR A 


55. 画 出 图 10-59 中 五 输入 二 输出 控制 框 的 非 简 略 实现 。 
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时 序 电路 





第 10 章 讨 论 了 组 合 设备 ， 它 们 在 计算 机 设计 中 很 常用 。 尽 管 如 此 ， 仅 把 组 合 电路 互联 
起 来 是 不 可 能 构造 出 哪怕 最 小 的 计算 机 的 。 在 所 有 提 到 的 组 合 设备 中 ， 输 出 只 取决 于 输入 。 
当 输 入 改变 时 ， 只 需要 几 个 门 延迟 时 间 ， 输 出 就 会 发 生 改 变 。 

电路 的 状态 ( state) 是 时 序 电路 区 别 于 组 合 电路 的 特性 ， 时 序 电路 能 记 住 它 处 在 什么 状 
态 ， 换 名 话说 就 是 它 有 记忆 。 时 序 电 路 的 输出 不 仅 取 决 于 输入 也 取决 于 它 的 状态 。 

本 章 讲述 怎样 构建 基本 的 时 序 元 件 ， 以 及 怎样 连接 它们 以 在 更 高 抽象 层次 上 形成 有 用 的 
块 ， 最 后 讲述 一 些 设备 ， 在 下 一 章 中 会 把 这 些 设备 连接 起 来 构成 Pep/9 计算 机 。 


11.1 锁 存 器 与 时 钟 触发 器 


时 序 设备 由 在 第 10 章 中 讲述 的 同样 的 门 构成 ， 不 过 它 有 一 种 不 同 的 连接 方式 一 一 反馈 
(feedback)。 在 组 合 电路 和 描述 它们 的 布尔 表达 式 中 ， 每 个 门 的 输出 会 连接 到 之 前 未 连接 过 
的 门 的 输入 。 然 而 ， 反 馈 连 接 会 形成 回路 或 环 路 ， 一 个 或 多 个 门 的 输出 “反馈 ”到 电路 中 前 
面 的 门 的 输入 。 

图 11-1 展示 的 是 两 个 简单 的 有 反馈 连接 的 电路 。 图 11-1a 
是 一 串 三 个 反 相 器 ， 最 后 一 个 反 相 器 的 输出 反馈 到 第 一 个 反 相 - 

器 的 输入 。 要 分 析 这 个 电路 的 行为 ， 假 定 d 点 的 值 为 1。 由 于 a) 不 稳定 电路 

反馈 回路 把 4 连接 到 了 a 点 ， 因 此 a 点 的 值 一 定 也 是 1。 一 个 

JIERS, b 点 的 值 一 定 为 0 (尽管 为 了 简便 起 见 我 们 在 前 面 
忽略 了 反 相 器 的 延迟 ， 但 在 这 个 电路 里 必须 要 考虑 延迟 )。 再 b) 稳定 电路 

经 过 一 个 门 延迟 后 ,ec 点 将 为 1， 在 第 三 个 门 延 迟 后 , d 将 为 0。 

现在 的 问题 是 分 析 开 始 时 ， 我 们 假设 d 点 为 1， 现在 它 变 
为 0， 经 过 三 个 门 延 迟 后 ， 它 又 变 成 了 1。 这 个 电路 会 振荡 ， 

每 隔 几 个 门 延 迟 ， 电 路 中 每 个 点 的 值 会 在 1 和 0 之 间 来 回 变换 。 仅 能 保持 几 个 门 延 迟 时 间 不 
变 的 状态 称 为 非 稳 态 (unstable state), 

图 11-1b 中 ， 如 果 假 定 e 点 的 值 为 1， 那 么 a 点 将 为 1, b 将 为 0, 将 为 1， 这 和 开头 
的 假设 是 一 致 的 。 这 样 的 状态 是 稳定 的 ， 电 路 中 所 有 的 点 将 永久 地 保持 它们 的 值 。 

另 一 种 可 能 的 稳 态 是 点 c 和 a 的 值 为 0, b 为 1。 如果 构建 这 样 的 一 个 电路 ， 它 会 处 于 哪 
种 状态 呢 ? 点 会 是 0 还 是 1 呢 ? 和 所 有 电子 设备 一 样 ， 门 需要 一 个 电源 打开 才能 运行 。 如 
果 构 建 图 11-1b 的 电路 并 打开 它 ， 它 的 状态 会 随机 建立 。 打 开 电 路 时 ,c 点 有 一 半 的 机 会 为 
0, 一 半 的 机 会 为 1。 电 路 会 一 直 保 持 电源 打开 时 建立 的 那 种 状态 。 


11.1.1 SR 锁 存 器 
为 了 实用 ， 时 序 设 备 需 要 一 种 设置 状态 的 机 制 。 图 11-2 的 SR 锁 存 器 (SR latch) 就 是 


图 11-1 简单 的 反馈 电路 
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这 样 一 种 设备 。S 和 及 是 它 的 两 个 输入 ， 它 的 两 个 输出 是 Q 和 Q GEE Q bar)。 两 个 反馈 
连接 是 从 Q 到 下 面 NOR Hii AKA QA LA 
NOR 的 输入 。 R 

来 看 看 稳 态 的 可 能 性 ， 假 定 S 和 有 R 都 是 0，Q Q 
也 是 0。 下 面 门 的 两 个 输入 都 是 0， 这 使 得 @Q 为 
1。 上 面 NOR 的 两 个 输入 为 0(R) 和 1(Q)。 因 
此 上 面 NOR 的 输出 是 0， 这 和 我 们 开头 对 Q 的 假 0 
设 是 一 致 的 ， 因 此 当 SR=00 时 ，QQ=01 是 稳 态 。 S 

从 这 个 稳 态 开始 ， 思 考 一 下 如 果 将 输入 SE 图 11-2 SR 锁 存 器 
为 1 会 发 生 什 么 。 图 11-3 概括 了 这 个 事件 序列 。 
Tg 表示 一 个 门 延 迟 的 时 间 间 隔 ， 通 常 是 2ns。 

在 时 间 0，S 变 为 1， 这 使 得 下 面 门 的 两 个 输 
AZER 1 (S) 和 0 (Q)。 一 个 门 延 迟 后 ， 这 个 变化 
的 影响 传播 到 Q，Q 变 为 0。 现 在 上 面 门 的 两 个 输 
入 为 0(R) 和 0(Q)。 再 经 过 一 个 门 延 迟 后 ， 上 
面 门 的 输出 变 为 1。 现 在 下 面 门 的 两 个 输入 为 1S) | on 
和 1 (Q)， 这 使 得 其 输出 为 0。 gw Ennem paN 

不 过 下 面 门 的 输出 已 经 为 0， 因 此 没有 变化 。 ‘M9 在 SR 镇 存 器 中 将 S 变 为 1 
因为 沿 着 反馈 连接 跟踪 得 到 一 致 的 值 ， 所 以 最 后 ZOR ee oe aE 
一 个 状态 是 稳定 的 。 图 11-3 的 中 间 两 个 状态 是 不 了 
稳定 的 ， 因 为 它们 仅 持 续 了 几 个 门 延迟 的 时 间 。 

如 果 把 S$ 改 回 0 会 怎么 样 呢 ? 图 11-4 展示 
了 这 个 事件 序列 。 下 面 门 的 两 个 输入 为 0(S) 和 
1 (Q)， 所 以 它 的 输出 为 0。 它 已 经 为 0 了 ， 电 路 
中 也 没有 其 他 变化 ， 所 以 该 状态 是 稳定 的 。 

从 图 11-3 和 图 11-4 可 以 看 到 ， 当 SR 锁 存 器 处 于 稳 态 时 ，Q 总 是 Q 的 补 。 上 面 加 一 横 
是 补 的 另 一 种 常用 的 符号 表示 ， 等 同 于 第 10 章 中 使 用 的 一 撤 的 符号 表示 。 

将 图 11-3 中 第 一 个 状态 和 图 11-4 中 最 后 一 个 状态 进行 比较 可 以 看 到 ， 两 种 情况 中 SR 
都 等 于 00, 但 是 第 一 种 情况 的 输出 是 Q=0， 第 二 种 情况 的 输出 是 Q=1。 输 出 不 仅 取 决 于 输 
人， 也 取决 于 锁 存 器 的 状态 。 

S 变 为 1 又 变 回 0 的 效果 是 将 状态 设置 为 Q=1。 如 果 锁 存 器 以 SR=00 和 状态 Q=1 开始 ， 
那么 通过 类 似 的 分 析 可 以 看 到 把 R 变 为 1 又 变 回 0 将 会 把 状态 重 置 为 Q=0。S 表示 设置 ，R 
表示 重 置 。 

SR 锁 存 器 类 似 于 墙 上 的 电灯 开关 。 将 $ 变 为 1 再 变 回 0 就 像 把 开关 推 上 打开 电灯 ， 将 
R 变 为 1 再 变 回 0 就 像 把 开关 拉 下 。 如 果 开 关 已 经 是 打开 状态 ， 那 么 再 尝试 打开 它 时 不 会 发 
生 什么 改变 ， 开 关 仍 然 是 打开 状态 。 类 似 情 况 ， 如 果 Q 已 经 是 1 了 , 把 $ 变 为 1 再 变 回 0 
时 状态 不 会 改变 ，Q 仍然 为 1。 

一 般 情 况 下 SR 锁 存 器 的 输入 条 件 是 SR=00。 要 设置 或 重 置 锁 存 器 ， 就 要 把 S 或 者 了 变 
为 1 再 变 回 0。 通常 S 和 有 不 会 同时 为 1， 如果 S 和 R 都 是 1， 那么 Q 和 G 就 会 都 为 0，Q 
将 不 是 Q 的 补 。 此 外 ， 如 果 将 SR=11 同时 改 为 SR=00， 那么 锁 存 器 的 状态 是 不 可 预知 的 。 
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图 11-4 在 SR 锁 存 器 中 将 S 变 回 0 
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一 半 的 可 能 是 QQ=01, 一 半 的 可 能 会 是 QQ=10。 实 际 中 不 会 出 现 SR=11 的 情况 。 

时 序 图 (timing diagram) 是 当 信号 随时 间 变 化 时 时 序 电 路 行为 的 图 形 化 表示 。 图 11-5 
是 一 个 时 序 图 ， 它 展示 了 输出 Q 和 Q 随 输 入 S 和 R 的 改变 而 改变 , 横 轴 是 时 间 ， 纵 轴 是 电 
压 ， 高 电 平 为 1， 低 电 平 为 0。 


图 11-5 SR 锁 存 器 的 时 序 图 


从 这 个 时 序 图 中 我 们 可 以 看 到 初始 状态 Q=0， 在 时 间 点 a, S 变 为 1, Q 马上 被 设置 为 1， 
@ 被 设置 为 0。 图 中 显示 变化 是 同时 发 生 的 。 就 像 前 面 分 析 的 一 样 ，Q 将 在 S 改变 一 个 门 延 
述 的 时 间 之 后 才 会 变化 ，Q 将 在 这 之 后 一 个 门 延迟 的 时 间 再 变化 。 这 张 时 序 图 假设 的 时 间 比 
例 尺 太 大 ， 不 能 展示 出 像 门 延迟 这 样 短 的 时 间 间 隔 。 

当 S 变 回 0 时 ， 状 态 不 改变 。 在 时 间 点 b，R 变 为 1 时 ，Q 重 置 为 0。 当 S 在 时 间 点 c 
又 变 为 1 时 ，Q 被 设置 为 1。 在 时 间 点 4，S 从 0 变 为 1， 这 不 会 改变 锁 存 器 的 状态 ， 因 为 Q 
已 经 是 1 了 。 在 图 中 所 有 点 处 Q 都 是 Q 的 反 。 

图 11-5 中 显示 的 转换 是 瞬间 完成 的 ， 而 现实 中 没有 什么 可 以 不 耗 时 就 发 生 。 如 果 放 
大 时 间 比 例 尺 ， 转 换 将 会 呈现 为 在 每 个 点 有 一 定 坡度 的 、 更 加 平缓 的 变化 。 可 以 把 时 序 图 
中 同时 瞬间 的 转换 看 作 一 个 高 层次 的 抽象 ， 它 隐藏 了 低 抽 象 层次 的 门 延迟 和 平缓 的 坡度 
变化 。 


11.1.2 SHH SR 触发 器 


计算 机 中 的 子 系统 由 许多 组 合 设备 和 时 序 设备 组 成 。 每 个 时 序 设备 就 像 一 个 SR 锁 存 
器 ， 处 于 两 种 状态 之 一 。 当 计算 机 执行 加 诺 依 曼 周 期 时 ， 所 有 时 序 设备 的 状态 随 着 时 间 而 
改变 。 要 以 有 序 的 方式 控制 这 一 大 堆 设 备 ， 计 算 机 就 要 维护 一 个 时 钟 ， 并 要 求 所 有 设备 同 
时 改变 它们 的 状态 。 时 钟 始终 持续 生成 脉冲 序列 ， 如 图 11-6 所 示 ，Ck 表示 时 钟 脉冲 (clock 
pulse). 

|<— r—>| 
Ck = bL LT OLD LOL 


图 11-6 时钟 脉冲 序列 


每 个 时 序 设备 除了 其 他 输入 外 ， 都 有 一 个 Ch 输入 。 设 备 仅 在 时 钟 脉冲 期 间 响 应 它 的 输 
入 。 脉 冲 之 间 的 时 间 ， 图 中 用 了 表示 ， 是 时 钟 的 周期 (period)。 周 期 越 短 ， 设 备 改变 状态 就 
越 频 繁 ， 电 路 计算 速度 就 越 快 。 

图 11-7 是 有 时 钟 输入 的 SR 锁 存 器 ， 叫 作 触 发 器 (flip-flop)。 它 由 和 图 11-2 所 示 同 样 
的 一 对 有 反馈 的 NOR 门 组 成 ， 不 过 SR 不 是 直接 输入 到 NOR 门 ， 而 是 先 通过 两 个 作为 使 能 
端的 AND 门 。 图 11-7a 是 框图 ， 图 11-7b 是 它 的 一 种 实现 。 注 意 这 个 框图 使 用 的 惯例 是 把 
S 放 在 框图 上 面 Q 的 对 面 ， 而 实现 中 S 在 Q 的 对 面 。 
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在 Ck 为 低 电 平 期 间 ， 不管 S 和 R 的 值 是 什么 ，NOR 门 的 输入 都 为 0。 当 NOR 门 的 输 
人 为 0 时 ,意味 着 锁 存 器 不 会 改变 状态 。Ck 为 高 电 平 期 间 ，S 和 RR 不 改变 地 通过 使 能 门 ， 
设备 按照 图 11-2 的 SR 锁 存 器 方式 运行 。 除 非 Ck 为 高 电 平 ， 否 则 AND 门 保护 NOR 门 免 
受 S 和 RR 的 影响 。 图 11-8 给 出 了 这 个 设备 行为 的 时 序 图 ，Q 一 直 是 Q 的 补 ， 在 本 图 中 没有 
给 出 。 


Q 
—|s Q Q 
Ck S 
Je R Q 
Ck 
a) 框图 b) 实现 


图 11-7 钟 控 SR 触发 器 





图 11-8 钟 控 SR 触发 器 的 时 序 图 


4S 变 为 1 时 ， 这 个 改变 不 会 影响 Q， 因 为 时 钟 仍然 是 低 电 平 。 在 时 间 点 a 时 钟 变 为 高 
电 平 ，Ck 允许 SR=10 通过 AND 门 ， 设 置 锁 存 器 Q=1。 稍 后 当时 钟 变 为 低 电 平时 ，Ck 禁止 
SR 输入 锁 存 器 。 如 果 R 在 时 间 点 b 之 前 就 变 为 1， 这 不 会 影响 锁 存 器 的 状态 。 只 有 在 时 间 
点 b，Ck 再 次 高 电 平时 ，R 才能 重 置 锁 存 器 。 

时 钟 为 高 电 平时 ， 在 一 个 时 间 间 隔 内 ， 实 际 上 是 有 可 能 让 S AR 做 几 次 转换 的 ,但 是 
现实 中 不 会 发 生 这 样 的 情况 。 电 路 的 主要 设计 思路 是 ,把 SR 输入 设置 成 想 要 的 转换 ， 然 后 
等 待 下 一 个 时 钟 脉冲 。 当 时 钟 脉冲 到 来 时 ， 状 态 可 以 根据 S ALR 的 值 而 改变 。 时 钟 变 为 低 
电 平 之 后 ， 电 路 给 下 一 个 脉冲 准备 SR 值 。 

均匀 分 布 的 脉冲 使 任何 状态 改变 只 在 均匀 分 布 的 时 间 间 隔 发 生 。 图 11-8 的 S 和 有 R 输 入 
与 图 11-5 的 输入 一 样 ,但 是 Q 中 相应 的 状态 变化 被 时 钟 平滑 了 。 时 钟 的 作用 就 是 使 时 间 
(时 序 图 的 横 轴 ) 数字 化 ， 同 电子 电路 使 电压 信号 ( 纵 轴 ) 数字 化 的 方法 一 样 。 就 像 信号 一 定 
或 者 为 高 电 平 或 者 为 低 电 平 而 绝 不 会 是 中 间 的 情形 一 样 ， 时 序 电 路 的 状态 改变 一 定 发 生 在 某 
个 时 钟 脉冲 或 另 一 个 时 钟 脉冲 ， 绝 不 会 在 两 个 脉冲 之 间 。 


11.1.3 EM SR 触发 器 
锁 存 器 只 有 当时 钟 为 高 电 平时 才 对 Ck 进行 响应 ， 所 以 图 11-7 的 时 钟 触发 器 称 为 电 平 敏 
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感 的 (level sensitive)。 尽 管 这 个 设备 会 像 预 期 的 那样 遵循 时 钟 ， 但 是 它 有 一 个 严重 的 实际 
缺陷 ， 图 11-9 说 明了 这 个 问题 。 

此 图 展示 了 SR 设备 的 一 种 可 
能 的 互联 情况 。 时 序 设备 的 输出 
包含 一 个 穿 过 某 个 组 合 电路 的 反 
馈 环 ， 最 终 通 向 同一 时 序 设 备 的 输 
人 人， 这 是 很 常见 的 。 图 中 有 一 个 三 
输入 两 输出 的 组 合 电路 ， 其 中 两 个 
输入 是 SR 时 序 设备 的 输出 反馈 。 
这 个 反馈 环 同时 还 是 NOR 门 的 反 图 11-9 SR 设备 的 互联 问题 
馈 ， 图 中 没有 在 SR 框 中 显示 出 来 。 

想 一 想 如 果 SR 触发 器 是 电 平 敏感 的 会 发 生 什 么 。 假 设 SR 是 10，QQ 是 01， 时 钟 是 低 
电 平 。 因 为 时 钟 禁止 SR 进入 NOR 锁 存 器 ， 所 以 S 不 会 将 Q 设 置 为 1。 现 在 假设 时 钟 变 为 
高 电 平 ， 经 过 几 个 门 延 迟 后 ，SR 将 Q 设置 为 1。 

现在 想 想 QQ 的 变化 ， 在 用 同样 的 外 部 输入 经 过 组 合 电路 后 ， 使 SR=01。 如 果 Ck 仍然 
为 高 电 平 ， 那么 时 钟 将 允许 SR 的 值 再 经 过 几 个 门 延 迟 后 将 Q 重 置 为 0。 不幸 的 是 ，QQ 的 
值 01 将 再 次 通过 组 合 电路 ， 把 SR 变 为 10。 

你 应 该 认识 到 这 个 状况 是 不 稳定 的 。 每 过 几 个 门 延迟 ， 只 要 时 钟 是 高 电 平 ， 时 序 设 备 的 
反馈 连接 就 使 得 SR 触发 器 改变 状态 。 时 钟 为 高 电 平 时 ， 状 态 会 改变 成 百 上 千 次 。 当 时 钟 在 
脉冲 未 端 最 后 变 成 低 电 平时 ， 不 可 能 准确 预测 触发 器 处 于 什么 状态 。 

因为 穿 过 组 合 电路 的 反馈 连接 对 于 构建 计算 机 子 系统 来 说 是 必需 的 ， 所 以 我 们 需要 时 序 
设备 不 仅 要 限定 在 时 钟 脉冲 期 间 才 会 改变 状态 ， 而 且 要 避免 受到 反馈 连接 的 进一步 改变 。 设 
备 需 要 对 它 的 输入 在 极其 短 的 时 间 内 敏感 ， 短 到 不 管 反馈 通过 组 合 电路 并 改变 SR 有 多 快 ， 
这 个 改变 都 不 能 再 影响 触发 器 的 状态 。 

设计 这 样 的 设备 有 两 种 技术 : 边沿 触发 和 主 从 。 边 沿 触发 (edge-triggered) 触发 器 不 会 
在 时 钟 为 高 电 平时 对 输入 敏感 ， 而 是 当时 钟 从 低 电 平 转换 到 高 电 平时 对 输入 敏感 。 边 沿 触发 
触发 器 的 实现 要 比 主 从 触发 器 更 难于 理解 ， 尽 管 它 是 两 种 技术 中 更 常用 的 ， 但 是 在 这 里 我 们 
不 进行 讲解 。 了 解 这 两 类 触发 器 都 解决 了 反馈 连接 引发 的 同样 的 问题 ， 这 就 足够 了 。 

图 11-10 展示 的 是 主 从 ( master-slave) SR 触发 器 的 实现 ， 主 触发 器 和 从 触发 吉 都 是 电 
平 敏感 的 钟 控 SR 触发 器 。 主 触发 器 (Q2 ) 的 Q 输 出 连接 从 触发 器 (R2 ) 的 RR 输入 ， 主 触 
发 器 (Q2) 的 Q 输出 连接 从 触发 器 (S2) WS HA, Ck 连接 主 触发 器 的 使 能 端 ，Ck 的 补 连 
接 从 触发 器 的 使 能 端 。 主 从 触发 器 的 框图 和 电 平 敏感 的 触发 器 是 一 样 的 。 

主 触发 器 是 一 个 SR 触发 器 ， 因 此 Q2 和 Q2 将 会 一 直 互 为 补 。Q2 连接 从 触发 器 的 S2， 
Q2 连接 从 触发 器 的 R2， 那 么 时 钟 到 达 从 触发 器 时 ,将 根据 主 触发 器 的 状态 被 设置 或 者 重 
置 。 如 果 主 触发 器 处 于 状态 Q2=1， 那 么 将 把 从 触发 器 也 设置 为 Q=1 ; 如 果 主 触发 器 处 于 状 
AS Q2=0， 那 么 将 把 从 触发 器 重 置 为 Q=0。 使 用 主 从 这 个 术语 就 是 因为 时 钟 到 达 从 触发 器 
时 ， 它 会 接受 主 触发 器 的 状态 。 

JÉJ WAE (threshold) 是 刚好 能 导致 输出 变化 的 输入 信和 号 值 。 要 使 主 从 电路 正确 地 工作 ， 
主 触 发 器 的 反 相 器 和 使 能 门 必须 具有 特殊 的 阅 值 。 反 相 器 的 阅 值 V1 必须 小 于 主 使 能 门 的 阐 
值 V2。 


输出 
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a) 框图 b) 实现 
Fl 11-10 主 从 SR 触发 器 


图 11-11 展示 了 V1 和 V2 与 Ck 在 一 个 时 钟 脉 冲 内 放大 的 时 序 图 的 关系 。 时 钟 不 是 从 
低 电 平 到 高 电 平 的 瞬时 转化 ， 而 是 逐步 增长 首先 在 
时 间 点 t 到达 V1， 接 着 在 时 间 点 到 达 V2， 最 后 
到 达 高 电 平 。 在 下 降 的 过 程 中 ,在 时 间 点 已经 过 V2， 
在 时 间 点 经 过 V1。 

在 脉冲 开始 向 上 转变 前 ， 主 触发 器 是 禁止 输入 
的 。 不 管 SR 的 值 是 什么 ， 主 触发 器 将 保持 已 有 的 状 
态 。 因 为 从 触发 器 输入 是 使 能 的 ， 所 以 反 相 器 确保 从 
输入 连 到 主 触 发 器 ， 从 和 触发 器 一 定 处 于 和 主 触发 器 相 
同 的 状态 。 

随 着 时 钟 信号 的 上 升 和 下 降 ， 经 过 时 间 点 a a hA u, AABERG TF : 

e ti: 将 从 触发 器 与 主 触发 器 隔离 开 

e ty: 主 触发 器 连接 到 输入 

et: 主 触 发 器 和 输入 隔离 开 

o ty: 将 从 触发 器 连接 到 主 触发 器 

在 时 间 点 二 ， 信 号 达到 反 相 器 的 阔 值 ， 使 反 相 器 的 输出 由 1 变 为 0。 从 和 触发 器 的 使 能 门 
为 0， 保 护 从 触发 器 不 受 S2 Al R2 的 影响 。 不 管 从 触发 器 在 时 间 点 t 是 什么 状态 ， 它 都 保持 
这 个 状态 直到 Ck MUA Vlo 

在 时 间 点 总 ， 信 号 达到 主 触发 器 使 能 门 的 阔 值 ， 使 主 触 发 器 对 SR 输入 敏感 。 如 果 SR 
是 10， 那 么 输入 将 会 把 主 触发 器 设置 为 Q2=1 ; 如 果 SR 为 01， 那 么 输入 将 重 置 主 触发 器 为 
Q2=0 ; 如 果 SR A 00, 那么 主 触发 器 的 状态 将 保持 不 变 。 如 果 主 触发 器 的 状态 不 变 ， 那 么 
它 的 新 状态 就 不 会 影响 从 触发 器 ， 因 为 在 时 间 点 二 从 触发 器 和 主 触 发 器 是 隔离 开 的 。 

思考 一 下 这 样 的 安排 是 怎样 让 触发 器 免 于 受 图 11-9 的 反馈 连接 影响 的 。 这 个 反馈 基于 
从 触发 器 的 QQ 输出 ， 主 触发 器 的 输入 不 会 导致 它 发 生 改 变 。V1 小 于 V2 确保 了 在 主 触 发 器 
变 为 对 输入 敏感 之 前 ， 从 和 触发 器 和 主 触发 器 是 隔离 的 。 就 算 穿 过 组 合 电路 的 门 延迟 是 0， 反 





ht 
时 间 
图 11-11 一 个 时 钟 脉冲 的 时 序 详解 图 
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馈 也 不 会 影响 从 触发 器 的 状态 。 

当 Ck 从 高 电 平 转变 为 低 电 平 时 ， 时 钟 在 时 间 点 4 到 达 V2。V2 是 主 触 发 器 使 能 门 的 靖 
值 ， 因 此 这 时 主 触发 器 变 得 对 输入 敏感 。 因 为 V2 比 V1 大， 所 以 从 触发 器 仍然 免 受 主 触发 
器 的 影响 。 

在 时 间 点 扣 ， 时 钟 信号 变 成 低 于 反 相 器 的 阔 值 ， 反 相 器 的 输出 从 0 变 为 1， 将 从 触发 器 
和 主 触 发 器 相连 。 不 管 主 触 发 器 的 状态 是 什么 ， 从 触发 器 都 会 被 强制 设置 成 这 个 状态 。 从 触 
发 器 可 能 会 改变 状态 。 如 果 从 触发 器 的 输出 反馈 到 主 触发 器 的 输入 ， 这 不 会 影响 到 主 触发 
器 ， 因 为 在 时 间 点 6 主 触 发 器 和 从 触发 器 的 输入 是 隔离 开 的 。 

主 从 电路 的 运行 大 致 类 似 于 宇宙 飞船 的 减 压 舱 。 在 飞船 内 ， 宇航 员 不 需要 穿 太 空 服 ， 而 
去 飞船 外 进行 太空 行走 则 要 穿 上 太空 服 进入 有 两 个 门 的 减 压 舱 ， 这 两 个 门 初始 是 关闭 的 。 

宇航 员 打 开 连 接 飞船 和 减 压 舱 的 内 门 进 入 减 压 舱 ， 然 后 关上 内 门将 减 压 舱 和 飞船 隔离 ， 
接着 打开 外 门 ， 减 压 舱 和 太空 就 连 上 了 ， 从 外 门 出 去 后 ， 再 将 外 门 关 上 。 在 任何 时 候 两 个 门 
不 会 同时 打开 ， 如 果 这 样 ， 飞 船 的 空气 就 会 全 部 泄漏 到 太空 里 。 

类 似 地 ， 主 从 电路 有 两 个 门 ， 一 个 门 连接 或 隔离 主 触 发 器 和 输入 ， 另 一 个 门 连接 或 隔离 
从 触发 器 和 主 触发 器 。 在 任何 时 候 两 个 门 不 会 同时 打开 ， 即 主 触发 器 连接 输入 且 从 触发 器 连 
接 主 触发 避 。 如 果 同 时 打开 ， 反 馈 环 会 在 电路 中 形成 不 稳定 的 状态 。 

图 11-12 是 主 从 SR 触发 器 行为 的 时 序 图 。 在 时 间 点 4 从 触发 器 连接 主 触 发 器 ， 从 触发 
器 的 状态 Q 发 生 改 变 ， 这 发 生 在 Ck 从 高 到 低 的 转变 时 期 。 








图 11-12 EAM SR 触发 器 的 时 序 图 
由 于 触发 需 不 是 组 合 电路 ， 真 值 表 不 足以 刻画 它 的 行为 ， 取 而 代 之 的 是 特征 表 

( characteristic table)， 它 说 明了 给 

定 输入 和 初始 状态 在 一 个 时 钟 脉冲 Me 

后 的 状态 。 图 11-13 是 SR 触发 器 




















的 特征 表 。 0 0 0 0 无 变化 

S(t) Al R(t) 是 在 时 钟 脉 冲 之 前 ° ‘ 
时 间 点 + 的 输入 ，Q(D) AERTS = RS ORE we 
冲 之 前 触发 器 的 状态 ，QC+D 是 Rare tea 
脉冲 之 后 的 状态 。 从 这 个 表 可 以 1 0 0 1 设置 
看 出 ， 如 果 SR 为 00， 那 么 在 时 钟 9 i ‘ 
到 达 的 时 候 ， 设 备 状 态 不 会 改变 ; F pee ae e me Dates eee 
如 果 SR 为 10, 设备 设置 为 Q=1。 B A 
如 果 时 钟 到 达 时 SR=11， 那 么 无 图 11-13 SR 触发 器 的 特征 表 


法 预测 设备 是 什么 状态 。 
特征 表 实 质 上 是 一 个 状态 变换 表 ， 类 似 于 有 限 状 态 机 的 图 7-11。SR 触发 器 是 一 个 有 限 
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状态 机 ， 有 两 种 可 能 的 状态 ，Q=0 和 Q=1。 和 任何 有 限 状 态 机 一 样 ， 它 的 行为 可 以 用 一 个 状 
态 转换 图 来 表示 。 图 11-14 是 SR 触发 器 的 状态 转换 图 。 

圆圈 表示 状态 机 的 状态 ， 圆 圈 里 是 Q 的 值 。 转 换 用 引起 指定 转换 的 SR 值 标记 出 来 ， 例 
如 从 Q=0 到 Q=1 的 转换 标记 为 SR=10。 648 


11.1.4 ”基本 触发 器 A l pIE 
下 面 是 计算 机 设计 中 常用 的 四 类 触发 器 : 


e SR 设置 / 重 置 


eK 设置 / 重 置 / 反 转 图 11-14 SR 触发 器 的 状态 转换 图 
eD 数据 或 延迟 
eT 反 转 


前 面 一 节 介 绍 了 怎样 构建 SR 触发 器 ， 它 的 特征 表 定 义 了 它 的 行为 。 其 他 三 种 触发 器 也 
有 定义 其 各 自行 为 的 特征 表 ， 每 一 种 都 能 由 SR 触发 器 加 上 几 个 其 他 的 门 构成 。 像 SR 触发 
器 一 样 ， 其 他 触发 器 都 有 Q 和 Q@ 输 出。 下 触发 器 有 两 个 输入 ， 标 号 为 J 和 天 ， 而 不 是 S 和 
R。D 和 了 T 触 发 器 都 只 有 一 个 输入 。 

从 SR 触发 器 构建 其 他 触发 器 有 一 个 系统 的 过 程 。 一 般 电路 通常 包含 图 11-9 的 结构 ， 
SR 触发 器 的 输出 Q AQ 作为 构建 中 设备 的 输出 Q 和 Q。 对 于 IK 触发 器 ， 图 11-9 的 输入 线 
实际 上 是 两 条 输入 线 ， 一 条 是 J 一 条 是 K。 对 于 DD 触发 器 来 说 ， 唯 一 的 输入 线 标记 为 D，T 
触发 器 的 输入 标记 为 T。 要 设计 每 一 个 触发 器 ， 必 须 确定 标记 为 组 合 电路 的 框 中 的 逻辑 门 和 
它们 的 互联 。 

和 任何 组 合 电 路 设计 一 样 ， 一 旦 确定 了 
真 值 表 形 式 中 的 输入 和 输出 ， 那 么 就 可 以 
背 助 于 卡 诺 图 来 构造 最 小 的 AND-OR 电路 。 
因此 ， 第 一 步 是 写 出 图 11-9 中 标记 为 组 合 电 
路 的 方 框 所 需 的 输入 和 输出 。 确 定 电路 描述 
的 一 个 有 用 工具 是 图 11-15 中 SR 触发 器 的 
激励 表 (excitation table). 

对 比 激励 表 和 图 11-13 的 特征 表 ， 特 征 
表 告 诉 你 给 定 当前 输入 和 状态 后 接 下 来 的 状 Bi) Sh 
态 是 什么 ， 但 激励 表 告 诉 你 如 果 想 要 得 到 某 
种 转换 ， 当 前 的 输入 必须 是 什么 。 下 面 讲述 根据 特征 表 怎 样 建立 激励 表 。 

表 中 第 一 个 条 目 是 Q=0 到 Q=0 的 转换 ， 两 种 可 能 的 输入 SR=00 和 SR=01 允许 这 种 转 
换 。SR 值 为 00 是 不 改变 的 条 件 ，SR 值 为 01 是 重 置 的 条 件 ， 这 两 个 条 件 都 会 使 触发 器 做 出 
从 Q=0 到 Q=0 的 转换 。 这 个 条 目 中 R(t) 下面 的 “x ”是 一 个 无 关 条 件 的 值 ， 只 要 S 为 0， 
不 必 关 注 R 值 是 什么 。 不 管 的 值 是 什么 ,转换 都 是 从 Q=0 到 Q=0。 

表 中 第 二 个 条 目 是 从 Q=0 到 Q=1 的 转换 ， 这 个 转换 发 生 的 唯一 方法 是 SR 的 输入 为 10， 
即 设置 条 件 。 类 似 地 ， 第 三 个 条 目 是 从 Q=1 到 Q=0 的 转换 ， 这 个 转换 只 有 在 SR 值 为 01 时 
才 会 发 生 。 

最 后 一 个 条 目 是 从 Q=1 到 Q=1 的 转换 ， 人 允许 这 个 转换 的 两 种 可 能 的 输入 条 件 ; 一 个 是 
SR=00， 即 不 改变 条 件 ; 一 个 是 SR=10， 即 设置 条 件 。 无 论 $ 的 值 是 什么 ， 如 果 有 为 0, Ap 
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么 这 个 转换 将 会 发 生 。S(D) 下 面 的 “ x ”说 明了 S 的 无 关 条 件 。 


11.1.5 JK 触发 器 


JK 触发 器 解决 了 SR 触发 器 中 未 定义 的 转换 。J 输 入 像 $ 一 样 设 置 设备 ， 玉 输入 像 R 一 
样 重 置 设备 。 但 是 当 巫 =11 时 ， 这 个 条 件 叫 作 反 转 条 件 。 反 转 意 味 着 从 一 个 状态 转换 到 另 
一 个 状态 。 在 反 转 条 件 下 ， 如 果 初 始 状态 为 0， 最 终 状 态 将 为 1 ; 如 果 初 始 状 态 为 1， 最 终 
状态 将 为 0。 图 11-16 是 IK 触发 器 的 框图 和 特征 表 。 





b) 特征 表 
图 11-16 JK 触发 器 


对 于 区 触发 器， 图 11-9 中 标记 为 组 合 电路 的 方 框 有 三 个 输入 和 两 个 输出 。 输 入 是 下 
K 以 及 来 自 反 馈 连 接 的 Q。 图 11-17 是 相同 的 具有 显示 相 输入 的 图 。 虚 线 框 定义 了 一 个 
= A (J. KAI Ck) 二 输出 
(Q 和 Q) KIJK fh E iko QF 
馈 在 更 低 的 抽象 层次 上 ,对 IK 
触发 器 的 用 户 来 说 是 不 可 见 的 。 
图 11-17 显示 只 有 一 个 出 自 SR 
触发 器 输出 的 反馈 线 Q。SR fik 
发 器 的 Q 输出 也 可 以 是 标记 为 
组 合 电路 方 框 的 输入 ， 只 不 过 
在 设计 组 合 电路 时 ， 始 终 认 为 
人 Pe eee 图 11-17 利用 SR 触发 器 构造 IK 触发 器 
三 输入 二 输出 的 电路 。 输 出 是 
S 和 R， 它们 都 是 三 输入 的 函数 ， 即 ，S=S(J, K, Q)，R=(J, K, Q)。 所 以 用 SR 触发 器 构造 JK 
触发 器 就 要 设计 两 个 三 输入 的 组 合 电路 ， 一 个 用 于 S， 一 个 用 于 R。 

首先 ， 借 助 SR 激励 表 写 出 图 11-18 的 设计 表 。 设 计 表 告诉 你 给 定 下 触发 器 要 做 出 
的 转换 时 ，SR 触发 器 必需 的 输入 。 前 三 列 列 出 了 组 合 电路 的 三 个 输入 所 有 可 能 的 组 合 。 





Ck 
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JK 的 值 最 好 排序 ， 因 为 它们 会 显示 在 卡 诺 图 中 。 第 四 列 是 时 钟 脉冲 之 后 的 Q 值 ， 每 个 
Q(t + 1) 的 值 来 自 于 下 触发 器 的 特征 表 。 例 如 ， 在 第 三 行 中 开 =11， 这 是 反 转 条 件 ， 所 以 
初始 状态 Q(D)=0 反 转 为 Q(t + 1)=1。 最 后 两 列 来 自 于 给 定 Q(?) Fl Q(t + 1) 的 SR 触发 器 的 
激励 表 。 例 如 ， 第 三 行 是 Q(t)Q(t + 1)=01 的 转换 ， 激 励 表 显示 要 实现 这 个 转换 ，SR 必须 
为 10。 





图 11-18 用 SR 触发 器 构造 JK 触发 器 的 设计 表 


下 一 步 是 写 出 这 个 函数 的 卡 诺 图 。 
图 11-19a 中 的 条 目 来 自 于 设计 表 中 标号 


JK 


为 S(t) 的 那 一 列 ， 图 11-18b 中 的 条 目 来 

自 于 设计 表 的 R( 列 。 0 GIDI o HH 
通过 检查 卡 诺 图 ， 可 以 写 出 S 的 最 2 Q 

小 erais 表达 S EARS, 图 Le [JED 

11-20 是 完整 的 设计 。 可 以 用 一 个 SR fh ac Gah pine 


发 器 和 两 个 二 输入 AND 门 来 实现 到 触 图 11-19 用 SR 触发 器 构造 JK 触发 器 的 卡 诺 图 
Riko ZIE JK 所 有 可 能 的 值 可 以 看 出 这 

个 设计 是 怎样 工作 的 。 如 果 IK=00, Af 

么 不 管 处 于 什么 状态 ，SR=00， 这 个 状 

态 不 会 改变 ; 如 果 IK=11, Q=0, 那么 J 
SR=10，Q 将 变 为 1; 如果 初始 Q=1， 那 k 
么 SR=01，Q 将 会 变 为 0。 两 种 情况 下 状 
态 都 会 反 转 ， 对 IK=11 也 是 同样 。 你 应 

该 也 能 分 析出 对 于 IK=01 和 下 =10， 这 

个 电路 也 会 正常 工作 。 





CK 
图 11-20 JK 触发 器 的 实现 
11.1.6 D 触发 器 


D 触发 器 是 一 个 除了 时 钟 之 外 只 有 一 个 输入 D 的 数据 触发 器 ， 图 11-21a 是 它 的 框图 ， 
图 11-20b 是 它 的 特征 表 。 表 中 可 以 看 到 Q( + 1) 与 Q(D 无 关 ， 它 只 取决 于 在 时 间 点 上 的 D 
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值 。D 触发 器 会 存储 该 数据 直到 下 个 时 钟 脉 冲 。 图 11-21: 展示 的 是 时 序 图 。 这 个 触发 器 也 
叫 作 延 迟 触 发 器 ， 因 为 在 时 序 图 中 ，Q 的 形态 和 D 是 一 样 的 ， 只 是 有 一 个 时 间 延 迟 。 





c) 时 序 图 
图 11-21 D 触发 器 


要 从 SR 触发 器 构建 一 个 DD 触发 器 ， 首 先 要 写 出 设计 表 。 因 为 除了 Q 以 外 只 有 一 个 输 
和 人， 所 以 如 图 11-22a 所 示 ， 表 中 只 有 四 行 。 图 11-22b 和 图 11-22c 展示 的 是 卡 诺 图 ， 只 包含 
四 个 单元 而 不 是 八 个 。AND-OR 电路 的 简化 得 到 S=D 和 R=D。 


x 


D D 
ri 0 1 0 1 
ey eee 


a) 设计 表 b) S 的 卡 诺 图 c) R 的 卡 诺 图 
图 11-22 从 SR 触发 器 构造 D 触发 器 的 设计 表 和 卡 诺 图 


图 11-23 Æ D 触发 器 的 实现 ， 除 了 SR 触发 器 ， 
只 需要 一 个 反 相 器 。 这 个 实现 方法 没有 像 下 触发 器 
的 实现 那样 有 来 自 Q 或 Q 的 反馈 连接 ， 这 是 因为 下 
一 个 状态 不 依赖 于 当前 的 状态 。 


11.1.7 工 触发 器 


T 触 发 器 是 一 个 反 转 触发 器 。 和 D 触发 器 一 
653| 样 ， 除 了 时 钟 外 ， 它 只 有 一 个 输入 T。 图 11-24a 是 
654| 框图 ， 图 11-24b 是 特征 表 。T 输入 就 像 一 条 控制 线 ， 图 11-23 DD 触发 器 的 实现 
指明 是 否 进 行 选 择 性 反 转 。 如 果 T 为 0， 触 发 器 不 
会 改变 状态 ; 如果 T 为 1， 触发 器 反 转 。T 触发 器 的 实现 作为 章 未 的 一 道 练习 。 
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a) 框图 b) 特征 表 
图 11-24 T 触 发 器 


11.1.8 激励 表 


前 面 几 节 讲 述 了 怎样 用 SR 触发 器 和 其 他 门 构建 恐 、D 和 了 T 和 触发 器 ， 也 可 以 用 同样 的 
系统 化 过 程 从 其 他 触发 器 来 构建 任何 触发 器 。 这 看 上 去 好 像 没 什么 意义 ， 例 如 用 IK 触发 器 
来 构建 D 触发 器 ， 因 为 最 开始 我 们 是 用 SR 触发 器 和 两 个 额外 的 门 来 构建 下 触发 器 的 ， 而 
只 需要 一 个 SR 触发 器 和 一 个 反 相 器 就 能 构造 出 D 触发 器 。 不 过 可 以 用 任意 触发 器 来 构建 其 
他 触发 器 这 一 事实 说 明了 所 有 触发 器 在 能 力 上 是 等 价 的 ， 即 用 某 种 触发 器 做 的 处 理 都 可 以 用 
其 他 触发 器 以 及 几 个 额外 的 门 来 实现 。 

例如 ,假定 有 一 个 JK 触发 器 ， 想 构建 一 个 T 和 触发 器 ,那么 就 要 从 T 的 特征 表 和 臣 的 
激励 表 写 出 设计 表 。 通 常 来 说 ， 要 从 触发 器 B 构建 触发 器 A， 需 要 A 的 特征 表 和 了 B 的 激励 
表 。 图 11-25 RARE IK, D 和 T 触 发 器 的 激励 表 。 





a) JK 触发 器 b ) D 触发 器 c) T fh zeae 
图 11-25 JK, DAIT fhe ae aoe 


我 们 应 该 验证 激励 表 的 每 个 条 目 。 例 如 IK 表 中 第 一 个 条 目 是 Q=0 到 Q=0 的 转换 。 用 
与 SR 触发 器 一 样 的 推理 ， 如 果 巫 为 00 或 01， 就 会 发 生 该 转换 ; 因此 KO 下 面 是 无 关 条 
件 。 第 二 个 条 目 也 有 一 个 无 关 条 件 。 在 这 两 种 情况 下 会 发 生 从 Q=0 到 Q=1 转换 。JK 可 以 为 
10 设置 条 件 ， 或 者 为 11 反 转 条 件 ， 两 者 都 允许 Q 从 0 变 为 1。 


11.2 ”时 序 分 析 与 设计 


时 序 电 路 是 门 和 触发 器 的 互联 。 理 论 上 可 以 把 所 有 门 组 合 进 一 个 组 合 电路 中 ,把 所 有 触 
发 器 组 合 进 一 组 状态 寄存 器 〈state register) H, WE 11-26 所 示 。 这 是 图 11-9 的 一 个 概括 ， 
它 只 包含 一 个 状态 寄存 器 ， 它 的 输出 不 需要 来 自 组 合 电路 的 附加 的 门 。 

图 11-26 中 的 实 线 箭头 表示 一 条 或 多 条 连接 线 ， 输 入 和 输出 线 是 到 电路 环境 的 外 部 连 
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接 ， 从 组 合 电路 到 状态 寄存 器 的 连 线 是 到 SR、JK、D 或 工 触发 器 的 输入 线 ， 反 馈线 是 从 触 
发 器 的 Q 和 Q 输出 到 组 合 电路 。 这 个 图 假 
设 状态 寄存 器 组 中 的 每 个 触发 器 都 使 用 一 
个 通用 的 时 钟 线 (未 在 图 中 显示 )。 

在 时 钟 脉 冲 之 间 ， 电 路 的 组 合 部 分 根 
据 外 部 输入 和 电路 的 状态 形成 输出 ， 即 每 
个 触发 器 的 状态 。 产 生 组 合 电路 输出 和 状 
态 寄 存 器 输入 所 花费 时 间 的 多 少 取决 于 电 图 11-26 ”通用 时 序 电路 
路 中 门 级 的 数量 。 Ck 周期 被 调整 到 足够 长 ， 
以 实现 在 下 一 个 时 钟 脉冲 之 前 允许 输入 通过 组 合 电 路 直到 输出 。 所 有 状态 寄存 器 都 是 边沿 触 
发 或 主 从 型 的 ， 以 防止 多 次 通过 反馈 环 。 

和 图 11-14 一样 ， 可 以 用 状态 转换 图 或 与 之 对 应 的 状态 转换 表 来 描述 一 个 通用 时 序 电 路 
的 行为 。 不 同 之 处 在 于 图 11-14 是 一 个 有 两 种 可 能 状态 的 设备 ， 而 图 11-26 是 nn 个 触发 器 。 
每 个 触发 器 有 两 种 可 能 的 状态 ， 因 此 这 个 








时 序 电路 总 共有 2" 种 状态 。 
硬件 层 的 分 析 和 设计 之 间 的 不 同 之 处 ax} +(e E RS 
和 软件 层 一 样 。 图 11-27 说 明了 这 种 不 同 。 a) 分 析 一 给 定 输入 和 时 序 电路 ， 确 定 输 出 


在 分 析 中 ,输入 和 时 序 电 路 是 给 定 的 ， 要 fa GIN an 
Peas WHERE AARAM b) eit 给 定 输入 和 输出， 确定 时 序 电 中 
的 输出 是 给 定 的 ， 要 确定 的 是 时 序 电 路 。 

下 节 展 示 了 怎样 由 给 定 的 时 序 电路 和 图 11-27 分 析 与 设计 的 区 别 
输入 流 来 确定 输出 。 总 的 思路 是 根据 电路 
构建 分 析 表 ， 根 据 分 析 表 就 可 以 很 容易 地 确定 状态 转换 表 、 状 态 转换 图 和 针对 给 定 输入 流 的 
输出 流 。 


11.2.1 时 序 分 析 问 题 


假设 给 定 图 11-28 的 电路 ， 状 态 寄 存 器 是 两 个 T 触 发 器 ， 标 识 分 别 为 FFA M FFB, 组 
合 电 路 是 两 个 AND 门 和 一 个 OR 门 的 组 合 ， 输 入 为 X1 和 X2， 唯 一 的 输出 是 Y。 反 馈 环 包 
括 标识 为 A 从 FFA 的 Q 发 出 的 线路 与 标 
WA B 和 百 两 条 从 FFB 的 Q 和 开发 出 的 
线路 。 到 FFA 的 输入 标识 为 TA， 到 FFB 
的 输入 标识 为 TB。 

因为 有 两 个 触发 器 ， 所 以 有 四 种 可 能 
的 状态 

AB = 00 

AB=01 

AB= 10 

AB=11 

在 这 里 以 AB=01 为 例 ， 它 意味 着 FFA 
的 Q=0 和 FFB 的 Q=1。 有 两 个 输入 ， 因 此 图 11.28 分 析 电 路 
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有 四 种 可 能 的 输入 组 合 

X1 X2 = 00 

X1 X2 =01 

X1 X2=10 

X1 X2 = 11 

问题 来 了 。 给 定 一 个 初始 状态 AB 以 及 初始 输入 XI 和 X2，a) 初始 输出 是 什么 ? b) 一 
个 时 钟 脉 冲 后 下 一 个 状态 将 会 是 什么 ”因为 有 四 种 状态 ， 每 个 状态 有 四 种 可 能 的 输入 组 合 ， 
所 以 需要 回答 这 些 问 题 16 遍 。 图 11-29 的 分 析 表 提供 了 一 种 回答 这 个 问题 的 系统 化 工具 。 





图 11-29 图 11-28 所 示 电 路 的 分 析 表 


前 4 列 是 初始 状态 和 初始 输入 所 有 可 能 组 合 的 列表 。 根 据 图 11-228，Y(D、TA(D 和 
TB(t) 的 布尔 表达 式 是 

Y(t1)=X1(t) * BD) 

TA(1)=X1(t) + B(t) 

TB(t)=X2(t)+A(0) 

AJE, X10 Fl) Al BCs) 列 的 补 进行 AND 44 3 Y) 5), X10 FH) Al BCD) 7 AY AND 得 到 
TA(?) 列 ，X2(?) FA A(t) 列 的 OR 得 到 TB(D 列 ， 根 据 T 触发 器 的 特征 表 ， 和 触发 器 的 初始 状 
态 和 它 的 初始 输入 可 以 计算 出 最 后 两 列 。 
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来 看 一 下 B(t+ 1) 列 。 在 第 一 行 中 ,根据 BO 列 看 到 FFB 的 初始 状态 是 0， 从 
TB(t) 列 可 以 看 到 触发 器 的 输入 为 0。 根据 图 11-24b 工 触 发 器 的 特征 表 ，0 是 无 关 条 件 ， 因 
此 状态 保持 一 致 ，B(1+1) 为 0。 国 

同样 看 这 一 列 ， 来 看 第 二 行 。 根 据 BO 列 ，FFB 的 初始 状态 又 是 0， 这 次 根 
Hi TBO 列 ， 和 触发 器 的 输入 是 1。 根 据 T 和 触发 器 的 特征 表 ，!1 是 反 转 条 件 ， 因 此 状态 反 转 ， 
B(t+ 1) 81. m 

图 11-30 的 状态 转换 表 是 从 分 
析 表 选 出 几 列 并 简单 重新 排列 的 结 A i ie al ce ie eileen, 

果 。 对 于 指定 的 初始 状态 A(DB()  ， 
和 指定 输入 X1(DOX2(D， 它 列 出 了 












































接 下 来 的 状态 A(t + 1)B(t + 1) 和 初 00 00, 0 01,0 00, 1 01,1 
始 输出 Y(D9。 状 态 是 一 个 有 序 对 ， mu Euo wao te 100 
表 中 的 每 个 条 目 是 下 一 个 状态 ， 后 rs ie lie we ike 
面 跟着 用 逗号 隔 开 的 初始 输出 。 yr ery w 
a m lo 00 008, ， 


相 比 于 状态 转换 表 ， 通 常 状 
态 转 换 图 更 容易 表明 电路 的 行为 。 DB 
图 11-31 是 根据 状态 转换 表 构 造 出 11-30 图 11-28 所 示 电 路 的 状态 转换 表 
的 状态 转换 图 。 标 准 惯例 是 用 输入 
的 有 序 对 来 标识 转换 ， 输 入 有 序 对 后 面 跟着 用 斜 线 隔 开 的 初始 输出 。 


01/0 
11/1 




















00/0 


10/0 00/0 11/0 
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00/0, 01/0, 10/1, 11/1 
图 11-31 图 11-28 所 示 电 路 的 状态 转换 图 。 转 换 标 识 为 XI(DX2(D/Y(D 


为 了 从 给 定 的 输入 流 确定 输出 ， 假 定 从 状态 AB=11 开始 ， 输 入 下 面 的 X1 X2 值 : 

11, 11, 00, 10, 01 
根据 状态 转换 图 ， 将 转换 到 如 下 的 状态 

11, 00, 01, 01, 11, 10 
并 产生 如 下 的 输出 

0, 1, 0, 0, 0 

对 包含 其 他 触发 器 甚至 不 同类 型 触发 器 混合 的 时 序 电路 ， 分 析 也 是 类 似 的 。 使 用 组 合 电 
路 的 知识 ， 可 以 轻松 确定 输入 和 状态 所 有 可 能 的 组 合 下 ， 每 个 触发 器 的 输入 。 然 后 ， 根 据 每 
个 触发 器 的 特征 表 可 以 确定 接 下 来 是 什么 状态 。 通 常 来 说 ， 如 果 有 浆 个 输入 和 开 个 触发 器 ， 
就 需要 分 析 22" 个 转换 。 
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11.2.2 ” 预 设置 与 清除 


前 面谈 到 问题 的 输出 序列 假设 触发 器 都 是 在 Q=1 这 个 状态 。 一 个 很 自然 的 问题 是 : 触 
发 器 怎样 进入 起 始 状态 呢 ? 实际 上 大 多 数 触发 器 都 有 两 个 额外 的 输入 ， 称 为 预 设置 ( preset) 
和 清除 (clear)。 这 两 个 输入 是 异步 的 (asynchronous)， 即 它们 不 依赖 于 函数 的 时 钟 脉冲 便 
能 工作 。 图 11-32 展示 的 是 一 个 带 异 步 预 
设置 和 清除 输入 的 SR 触发 器 的 框图 。 

在 通常 的 运行 中 ， 预 设置 和 清除 线 都 
是 0。 要 把 触发 器 状态 初始 化 到 Q=1， 就 
要 把 预 设置 设 为 1 再 变 回 0 ; 要 把 触发 器 
初始 化 为 0， 就 要 把 清除 设 为 1 再 变 回 0。 
这 两 个 输入 中 任 一 个 只 要 为 高 电 平 就 能 起 
作用 ， 不 需要 发 送 时 钟 脉冲 。 异 步 预 设置 
和 清除 的 实现 作为 章 末 的 一 道 练习 。 
11.2.3 ”时 序 设计 图 11-32 带 异 步 预 设置 和 清除 的 SR 触发 器 的 框图 


采用 时 序 设计 ， 电 路 的 行为 常常 以 状 
态 转换 图 的 形式 给 出 ， 需 要 确定 如 何 用 最 少数 量 的 门 来 实现 该 电路 。 同 时 ， 问 题 的 描述 中 也 
会 给 出 时 序 电路 中 使 用 的 状态 寄存 器 要 采用 哪 种 类 型 的 触发 器 。 

设计 过 程 包括 三 步 。 第 一 步 ， 根 据 状 态 转换 图 将 电路 的 转换 制 成 设计 表 ， 对 于 初始 状态 
和 输入 的 每 种 组 合 列 出 初始 输出 和 下 一 个 状态 。 然 后 ， 根 据 激励 表 列 出 导致 转换 所 需 的 触发 
器 输入 条 件 。 

第 二 步 ， 将 每 个 触发 器 输入 的 条 目 转换 到 卡 诺 图 。 如 果 在 设计 表 的 制 表 过 程 中 提前 考 
虑 ， 以 和 卡 诺 图 一 样 的 顺序 列 出 这 些 条 目 ， 将 有 助 于 防止 出 错 。 利 用 卡 诺 图 最 小 化 表达 式 ， 
设计 出 时 序 电路 中 组 合 电路 的 部 分 。 

第 三 步 ， 画 出 简化 后 的 组 合 电路 。 每 个 触发 器 的 输入 来 自 于 深度 最 多 为 两 个 门 级 的 组 合 
电路 。 可 以 把 这 个 过 程 看 作 是 由 SR fh RANE IK. D 和 T 触发 器 过 程 的 一 般 性 概括 。 


11.2.4 ”一 个 时 序 设计 问题 
这 个 例子 说 明 的 是 设计 过 程 。 问 题 是 it 
要 用 SR 触发 器 实现 图 11-33 的 状态 转换 
图 。 和 图 11-31 一 样 ， 转 换 标 上 了 输入 值 
X1 X2 和 初始 输出 Y。 状 态 圈 中 的 值 是 第 
一 个 SR 触发 器 FFA 和 第 二 个 SR 触发 器 
FFB 的 Q 值 。 01/0 
这 个 机 器 只 有 三 种 输入 组 合 和 四 种 状 
态 ， 总 共 12 种 转换 。 输 入 的 组 合 是 01、 
11 和 10。 由 于 组 合 00 预期 不 会 发 生 ， 因 
此 可 以 把 它 看 成 无 关 条 件 帮助 进行 最 小 化 。 10/1 
要 实现 有 八 个 状态 的 有 限 状 态 机 需要 
三 个 触发 器 ， 实 现 有 5 一 7 个 状态 的 机 器 图 11-33 ”一 个 设计 问题 的 状态 转换 图 








11/1 
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也 需要 三 个 触发 器 ， 但 是 有 些 状态 是 预期 不 会 发 生 的 ， 可 以 看 作 无 关 状 态 。 
图 11-34 是 设计 过 程 的 第 一 步 。 左 边 四 列 是 初始 状态 和 输入 所 有 可 能 的 组 合 ， 中 间 三 列 


[662] 是 根据 图 11-33 得 出 的 初始 输出 和 下 一 状态 的 简 表 。 
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图 11-34 图 11-33 所 示 状 态 转换 图 的 设计 表 


右边 有 四 列 是 因为 有 两 个 SR 触发 器 ， 每 个 触发 器 有 两 个 输入 。SA 是 FFA 的 S 输 入 ， 
RA 是 FFA 的 了 R 输 入 ， 以 此 类 推 。 产生 给 定 转换 的 触发 器 输入 条 件 来 自 图 11-15 的 SR 触发 
器 激励 表 。 

例如 ， 来 看 一 下 第 一 行 从 AB=00 到 AB=01 的 转换 。FFA 的 转换 是 从 Q=0 到 Q=0， 从 
激励 表 可 以 看 到 转换 由 $ 为 0 和 有 为 无 关 条 件 引 发 。FFB 的 转换 是 从 Q=0 到 Q=1， 从 激励 
表 可 以 看 到 这 个 转换 是 由 SR 为 10 导致 的 。 

下 一 步 ， 考虑 每 个 触发 器 的 输入 是 一 个 四 变量 函数 : 初始 状态 、AB 和 输入 X1 X2。 要 
设计 这 个 组 合 电路 ， 每 个 触发 器 输入 需要 一 个 四 变量 卡 诺 图 。 图 11-35 是 根据 图 11-34 得 出 
的 卡 诺 图 ， 图 11-35a 是 输入 SA 的 卡 诺 图 ， 可 以 看 到 行 的 值 是 状态 AB， 列 的 值 是 输入 X1 
X2。 请 注意 X1 X2=00 的 组 合 ， 卡 诺 图 第 一 列 是 无 关 条 件 。 

输出 Y 也 是 一 个 初始 状态 和 输入 的 函数 ， 需 要 一 个 卡 诺 图 来 最 小 化 。 每 个 卡 诺 图 下 面 
是 它 对 应 的 最 小 化 表达 式 。 

11-36 是 设计 得 出 的 时 序 电路 。 这 个 图 是 个 简略 的 形式 ， 并 没有 画 出 反馈 连接 。 

完成 设计 后 ， 你 可 能 注意 到 图 11-35: 和 图 11-35d 中 ， 卡 诺 图 的 单元 8 是 被 覆盖 的 ， 所 
以 看 上 去 值 为 1。 而 图 11-35a 和 图 11-35b 没有 履 盖 这 个 单元 ， 所 以 它 的 值 看 上 去 为 0， 怎 
么 会 这 样 呢 ?” 它 怎么 会 同时 既 为 0 又 为 1 呢 ? 卡 诺 图 没有 展现 出 对 无 关 条 件 实 际 上 会 发 生 什 
么 。 图 11-33 的 电路 描述 假设 外 部 输入 X1 X2 来 自 某 个 未 知 的 来 源 ， 组 合 X1 X2=00 在 实际 
中 绝 不 会 发 生 。 因 此 单元 8 代表 的 组 合 ， 即 A B XI X2=1000 绝 不 会 发 生 。 可 以 给 这 个 组 合 
选择 任何 你 想 要 的 电路 行为 方式 ， 因 为 它 根 本 不 会 发 生 。 
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c) SB=BXI1 d) RB=BX1+A X2 e) Y=AX2+AXI1 X2 
图 11-35 图 11-34 的 卡 诺 图 
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E 11-36 图 11-33 简化 的 时 序 网 络 


如 果 需 要 设计 一 个 状态 数量 不 等 于 2 的 短 的 状态 机 ， 也 可 以 用 同样 的 方式 思考 。 比 如 说 
想 设计 一 个 五 个 状态 的 状态 机 ， 两 个 触发 器 就 不 够 了 ， 因 为 它们 只 能 提供 四 个 状态 。 使 用 三 
个 触发 器 ， 可 能 有 八 种 状态 ， 但 实际 中 只 会 有 五 个 状态 发 生 ， 其 他 三 种 可 以 是 无 关 条 件 。 在 
设计 了 这 样 一 个 电路 后 ， 从 有 用 状态 不 能 到 达 无 用 状态 ， 但 反之 不 然 ， 即 可 能 有 从 无 用 状态 
到 有 用 状态 的 转换 ， 但 是 这 样 的 转换 是 无 关 的 ， 因 为 不 会 发 生 这 样 的 转换 ， 类 似 于 程序 中 的 
死 代码 。 

这 个 例子 中 描述 的 设计 过 程 有 两 个 触发 器 和 两 个 输入 ， 卡 诺 图 中 总 共有 四 个 变量 。 设 计 
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三 个 触发 器 一 个 输入 或 者 一 个 触发 器 三 个 输入 也 需要 四 变量 卡 诺 图 。 一 个 触发 器 两 个 输入 或 
者 两 个 触发 器 一 个 输入 的 设计 过 程 也 是 一 样 ， 只 不 过 用 三 变量 卡 诺 图 就 足够 做 最 小 化 了 。 

一 些 时 序 电路 需要 最 小 化 超过 四 个 变量 的 组 合 电路 。 卡 诺 图 不 能 很 方便 地 处 理 这 样 
大 小 的 问题 。 可 用 系统 化 过 程 处 理 此 类 问题 ， 其 中 最 常见 的 是 奎 因 一 麦克 拉 斯 基 ( Quine- 
McCluskey) 方法 ， 不 过 这 些 方法 都 超出 了 本 书 讨论 的 范围 。 


11.3 ”计算 机 子 系统 


计算 机 是 一 组 互联 的 子 系统 ， 每 个 子 系统 是 一 个 黑 盒 子 ， 有 定义 良好 的 接口 。 有 时 候 子 
系统 由 一 个 单独 的 集成 电路 组 成 ， 这 种 情况 中 接口 是 由 物理 封装 的 引 脚 的 运行 特性 描述 的 。 
在 更 低 的 抽象 层次 上 ， 这 个 子 系统 可 以 是 集成 电路 内 多 个 子 系统 的 一 部 分 。 或 者 在 更 高 的 抽 
象 层 次 上 ， 该 子 系统 可 以 是 一 个 印 制 电路 板 ， 由 几 个 集成 电路 组 成 。 

不 过 实际 上 子 系统 也 是 在 物理 上 实现 的 ， 总 线 把 各 个 子 系统 连接 在 一 起 。 总 线 可 以 是 一 
条 线路 ， 从 子 系统 的 一 个 门 的 输出 到 另 一 个 子 系统 的 一 个 门 的 输入 ， 或 者 它 也 可 以 是 包含 数 
据 和 控制 信号 的 一 组 线路 ， 就 像 图 4-1 Pep/9 中 连接 主 存 到 CPU 的 总 线 。 


11.3.1 寄存 器 


ISA3 层 机 器 的 一 个 基础 部 件 是 寄存 器 。 你 应 该 熟悉 Pep/9 CPU 中 的 16 位 寄存 器 ， 指 令 
集 包 括 操控 寄存 器 内 容 的 指令 。 图 11-37 展示 的 是 一 个 4 位 寄存 器 的 框图 和 实现 。 


DatalIn 


DatalIn 





DataOut DataOut 
a) 框图 b) H D 触发 器 实现 


11-37 一 个 4 位 寄存 器 


这 个 寄存 器 有 四 个 数据 输入 、 四 个 数据 输出 和 一 个 标记 为 Load 的 控制 输入 。 框 图 中 用 
一 个 宽 箭 头 表 示 四 个 数据 输入 线 ， 实 现 中 每 条 数据 线 是 单独 画 出 来 的 。 这 个 寄存 器 很 简单 ， 
就 是 一 组 D 触发 器 ， 每 条 数据 输入 线 连接 一 个 触发 器 的 D 输入 ， 每 条 数据 输出 线 连接 一 个 
触发 器 的 Q 输出 ，Load 输入 连接 所 有 触发 器 的 时 钟 输入 。 从 现在 开始 ， 用 阴影 来 表示 包含 
时 序 电路 的 图 ， 以 区 别 于 组 合 电路 。 

寄存 器 的 运行 要 把 希望 装 和 的 值 放 到 数据 输入 线 上 ， 然 后 给 装 和 人 信号 发 送 1 再 变 回 0， 
背 助 于 时 钟 把 数据 装 人 寄存 器 。 所 有 四 个 值 同时 装 和 寄存器。 如 果 每 个 触发 器 都 是 主 从 设 
备 ， 那 么 在 图 11-11 的 时 间 点 已 ， 当 从 触发 器 连接 到 主 触发 器 时 ， 将 会 出 现 输出 。 

在 寄存 器 中 每 个 D 触发 器 是 1 位 。 一 个 8 位 寄存 器 有 8 个 触发 器 ， 一 个 16 位 寄存 器 有 
16 个 触发 器 。 触 发 器 的 数量 不 会 影响 装 入 操作 的 速度 ， 因 为 每 个 触发 器 的 装 人 是 同时 发 生 
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的 。 不 管 寄 存 器 的 位 数 是 多 少 ， 它 的 框图 都 和 图 11-37a 所 示 的 一 样 。 


11.3.2 BE 


假设 两 个 子 系统 A 和 B 需要 来 回 发 送 数据 。 连 接 它 们 最 简单 的 方法 是 用 两 条 单 向 总 线 : 
一 条 发 送 从 A 到 B 的 数据 ， 一 条 发 送 从 B 到 A 的 数据 。 第 一 条 总 线 是 一 组 线路 ， 每 一 条 线 
从 A 的 一 个 门 输出 到 B 的 一 个 门 输入 。 第 二 条 总 线 的 每 一 条 线 从 B 的 一 个 门 输出 到 A 的 一 
个 门 输入 。 

这 样 安排 的 问题 是 对 于 宽 总 线 来 说 线路 的 数量 太 大 。 如 果 想 同时 发 送 64 位 ， 就 需要 两 
条 单 向 总 线 ， 总 共 128 条 线路 。 若 使 用 双向 总 线 ， 这 个 数量 就 能 减 半 ， 但 损失 的 是 速度 。 用 
两 条 单 向 总 线 ， 可 以 同时 从 A 向 B 和 从 B 向 A 发 送 数据 ， 而 双向 总 线 则 不 可 能 做 到 。 如 果 
要 改变 总 线 上 数据 流 的 方向 ， 还 必须 在 发 送 数据 之 前 付出 一 小 段 建立 时 间 的 代价 。 

图 11-38 展示 了 实现 双向 总 线 必 须要 解决 的 问题 。AND 门 表示 作为 寄存 器 一 部 分 的 主 
从 触发 器 的 主 时 钟 使 能 门 ，NOR 门 代 表 另 一 个 寄存 器 的 触发 器 的 从 Q@ 输 出 门 。 要 从 A 到 B 
发 送 数 据 ， 那 么 门 2 的 输出 必须 连 到 门 3 的 输入 。 从 B 到 A 发 送 数 据 ， 门 4 的 输出 必须 连 
到 门 1 的 输入 。 问 题 出 在 门 2 和 门 4。 总 是 可 以 把 一 个 门 的 输出 连 到 另 一 个 门 的 输入 ， 但 是 
不 能 把 两 个 门 的 输出 连接 到 一 起 。 假 定 门 2 想 发 送 一 个 1 到 门 3， 但 同时 门 4 的 输出 刚好 为 
0， 它 们 的 输出 是 冲突 的 ， 那 么 哪 一 个 会 占 优 呢 ? 


子 系统 A 子 系统 B 





图 11-38 ”双向 总 线 问 题 


答案 取决 于 底层 构造 门 的 技术 。 对 于 一 些 逻 辑 门 族 ， 实际 上 可 以 把 几 个 门 的 输出 连接 到 
一 起 ， 如 果 一 个 或 多 个 门 输出 1， 那 么 公共 的 总 线 将 传送 1。 由 于 总 线 上 的 信号 就 像 OR 门 
的 输出 ， 因 此 称 这 种 门 具有 线 -OR 属性 ( wired-OR property)。 对 于 其 他 逻辑 门 族 ， 把 两 个 
门 的 输出 连接 到 一 起 会 使 电路 崩溃 ,引发 不 可 预知 的 灾难 。 即 使 线 -OR 门 也 仍然 存在 双向 
总 线 的 问题 。 例 如 ， 如 果 门 2 想 发 送 0 到 门 3, 但 是 此 时 门 4 的 输出 碰巧 是 1， 那么 门 3 就 
会 错误 地 检测 到 一 个 1。 

为 了 使 双向 总 线 正常 工作 ， 需 要 找到 一 种 方法 ， 当 门 2 往 总 线 上 放 数 据 时 让 门 4 临时 与 
总 线 断 开 连 接 ， 反 之 亦 然 。 三 态 缓冲 器 可 以 精确 地 完成 这 
个 工作 ， 它 有 一 个 数据 输入 ， 一 个 使 能 控制 输入 和 一 个 输 
出 。 图 11-39 是 三 态 缓冲 器 的 真 值 表 ， 这 里 的 E 是 使 能 控 
HAG. a 是 输入 ,x 是 输出 。 当 设备 使 能 时 ， 输 入 不 变 地 到 
达 输 出 ; 当 设 备 禁 止 时 ,输出 实际 上 是 和 电路 断 开 的 。 从 
电子 学 角度 来 讲 ,输出 这 时 处 于 高 阻抗 的 状态 。 因 为 输出 
可 以 有 三 种 状态 : 0、1 和 断 开 ， 因 此 这 种 设备 叫 作 三 态 缓 
冲 器 。 图 11-39 三 态 缓冲 器 的 真 值 表 
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图 11-40 展示 的 是 三 态 缓冲 器 怎样 解决 双向 总 线 问 题 。 每 个 门 的 输出 和 总 线 之 间 有 一 个 
三 态 缓冲 器 。 要 从 A 到 B 发 送 数据 ,使 能 A 中 的 三 态 缓冲 器 ， 禁 止 B 中 的 三 态 缓冲 器 ， 反 
之 亦 然 。 要 使 这 个 机 制 能 正确 发 挥 作用 ， 子 系统 必须 协调 工作 ， 不 能 让 它们 的 三 态 缓冲 器 同 
时 使 能 。 


子 系统 A 





图 11-40 用 三 态 缓冲 器 解决 双向 总 线 问题 


11.3.3 ”内 存 子 系统 


内 存 子 系统 由 几 个 集成 电路 内 存 芯片 构成 ， 图 11-41 展示 的 是 两 个 内 存 芯 片 ， 每 一 个 可 
以 存储 512 位 。 内 存 芯 片 有 一 组 标记 从 A0 开始 的 地 址 线 ， 一 组 表 记 从 DO 开始 的 数据 线 ， 
一 组 标记 为 CS、WE 和 OE 的 控制 线 。 数 据 线 有 两 个 箭头 ， 表 示 它 们 应 该 连接 到 双向 总 线 。 
图 11-41a 表明 内 存 的 位 是 64 个 八 位 的 字 。 图 中 有 6 条 地 址 线 ， 因 为 2=64， 输 入 值 的 每 种 
可 能 组 合 会 访问 一 个 独立 的 8 位 字 。 图 11-41b 展示 的 是 同样 数量 的 位 被 组 织 成 512 个 一 位 
WF. APA 9 条 地 址 线 ， 因 为 2=512。 一 般 来 说 ， 有 2" 个 字 的 内 存 芯 片 就 及 n 条 地 址 线 。 
为 了 保持 例子 简单 ， 图 11-41 中 芯片 地 址 线 和 数据 线 的 数量 少 到 不 切实 际 ， 现 在 制造 的 内 存 


芯片 都 有 上 亿 位 。 
<> D0 es 
Al —> 
人 0 —> <> D1 ropen 
Al —> <> D2 ÀT a 
A2 —> <> D3 A i 
A3 —> <> D4 AS c D 
A4 —> <«—> D5 A6 
AS —> <> D6 AT —> 
<>» D7 
A8 —> 
CS WE OE CS WE OE 
a) 64x 8 内 存 芯 片 b )512x 1 内 存 芯 片 
图 11-41 两 个 的 存储 512 位 集成 电路 内 存 芯 片 


控制 线 有 如 下 作用 : 

e CS (chip select， 芯 片 选 择 ) 使 能 或 选择 内 存 芯 片 。 

e WE (write enable， 写 使 能 ) 把 一 个 内 存 字 写 人 或 存储 到 芯片 中 。 

e OE (output enable， 输 出 使 能 ) 使 能 输出 缓冲 器 ， 从 芯片 读 取 一 个 字 。 

要 把 一 个 字 存 储 到 芯片 ， 就 要 把 地 址 线 设置 为 这 个 字 要 存储 的 地 址 ， 把 数据 线 设置 为 想 
存储 的 值 ， 把 CS 设置 为 1 来 选择 这 个 芯片 ， 再 把 WE 设置 为 1 来 执行 写 人 。 从 芯片 中 读 取 
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一 个 字 ， 要 把 地 址 线 设 置 为 要 读 取 的 地 址 ， 把 CS 设置 为 1 来 选择 该 芯片 ， 把 OE 设置 为 1 
使 输出 使 能 ， 这 样 想 读 取 的 数据 就 会 出 现在 数据 线 上 了 。 在 实际 中 大 多 数 芯片 的 控制 线 都 是 
低 电 平 有 效 的 ， 即 它们 平常 维持 在 表示 为 1 的 高 电 平 ， 把 它们 设置 成 表示 为 0 的 低 电 平 即 可 
激活 。 为 了 例子 简单 ， 本 书 假定 内 存 芯 片 的 控制 线 为 高 电 平 有 效 。 

图 11-42 是 一 个 4x2 位 内 存 芯片 的 实现 ， 它 有 两 条 地 址 线 和 两 条 数据 线 。 存 储 4 个 2 
位 的 字 ， 每 位 是 一 个 D 触发 器 。 用 阴影 来 表示 时 序 设 备 以 区 别 于 组 合 设备 。 地 址 线 驱动 一 
个 2x4 译 码 器 ， 它 的 某 个 输出 为 1， 其 余 三 个 为 0。 译 码 器 为 1 的 那 条 输出 线 选择 一 行 D 
触发 器 ， 这 行 触发 器 组 成 芯片 要 访问 的 字 。 





图 11-42 一 个 4x2 位 的 内 存 芯 片 
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标记 为 读 使 能 的 方 框 提供 对 双向 总 线 的 接口 ， 图 11-43 是 它 的 实现 。DR 是 数据 读 取 线 ， 
来 自 于 图 11-42 中 的 OR 门 ，DW 是 数据 写 人 线 ， 去 往 触 发 器 的 D 输入 ，D 是 到 双向 总 线 的 
数据 接口 。 

图 11-44 是 这 个 电路 的 真 值 表 ， 芯 片 通常 是 下 面 三 种 模式 之 一 : 

© CS=0: SHAR EP 

e CS=1, WE=1, OE=0: 芯片 被 选中 写 入 。 

e CS=1，WE=0，OE=1: 芯片 被 选中 读 取 。 





DW DR 


CS 
OE 





a 1 1 | 把 DR 连接 到 DD 
图 11-43 图 11-42 中 标识 为 “ 读 使 能 ” 方 框 的 实现 图 11-44 “ 读 使 能 ” 方 框 的 真 值 表 


不 允许 WE 和 OE 同时 都 为 1。 从 真 值 表 和 它 的 实现 可 以 看 到 当 CS 为 0 时， 不 管 其 他 
控制 线 如 何 ，DR 总 是 从 双向 总 线 断 开 的 ; 当 CS 为 1、OE 为 0 时 ，DR 也 是 断 开 的 ， 这 就 
是 写 人 模式 ， 这 种 情况 下 数据 从 双向 总 线 送 到 DW; 当 CS 为 1、OE 为 1 时 ， 三 态 缓冲 器 是 
使 能 的 ， 数 据 从 DR 送 到 双向 总 线 。 

来 看 一 下 内 存 读 取 是 怎样 进行 的 ， 考 虑 一 个 场景 : Al AO =10，CS=1，WE=0 和 OE=1。 
Al AO 的 值 使 得 从 译 码 器 发 出 的 标号 为 “ 字 2” 的 线 为 1， 其 他 字 线 为 0。“ 字 2” 线 使 能 连 
接 第 2 行 D 触发 器 的 Q 输出 的 AND 门 ， 禁止 连接 其 他 所 有 行 触发 器 输出 的 AND 门 。 因 此 
来 自 第 二 行 的 数据 流 过 两 个 OR 门 到 达 “ 读 使 能 ” 方 框 ， 进入 双向 总 线 。 

内 存 的 写 和 人 要 借助 于 标记 为 MMYV 的 方 框 ， 图 11-42 P MMV 代表 单 稳 多 谐振 荡 器 
(monostable multivibrator)» BŒ D 触发 器 是 主 从 触发 器 的 变种 ， 存 储 需 要 一 个 Ck 脉冲 从 
低 电 平 到 高 电 平 然后 再 从 高 变 回 低 ， 如 图 11-11 所 示 。 单 稳 多 谐振 荡 器 就 是 一 个 提供 这 种 脉 
冲 的 设备 。 图 11-45 展示 的 是 有 初始 延迟 的 单 稳 多 谐振 荡 器 的 时 序 图 。 当 输入 线 升 高 时 就 会 
触发 一 个 延迟 电路 ， 经 过 一 个 预 设 的 时 间 间 隔 后 ， 延 迟 电路 触发 单 稳 多 谐振 荡 器 ， 发 出 具有 
预 设 宽度 的 时 钟 脉冲 。 单 稳 多 谐振 荡 器 激活 时 会 发 出 一 个 “ 单 次 ”( one shot) 脉冲 ， 因 此 它 
也 称 为 单 次 设备 。 


11-45 ” 带 初始 延迟 的 单 稳 多 谐振 荡 器 的 时 序 图 


来 看 一 看 内 存 写 人 是 如 何 进行 的 ， 考 虑 这 样 一 个 场景 : Al A0 =10，CS=1，WE=1 和 
OE=0。 假 设 地 址 线 、 数 据 线 和 控制 线 的 设置 是 同时 发 生 的 ， 内 存 电 路 必须 要 等 待 地 址 信号 
传播 过 译 码 器 ， 然 后 才能 根据 时 钟 脉 冲 把 数据 送 入 触发 器 。 工 程 上 设计 MMV 中 的 初始 延 
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迟 ， 就 是 为 了 留 出 足够 的 时 间 使 得 在 根据 时 钟 送 入 数据 之 前 译 码 器 的 输出 能 够 设置 好 。“ 读 
使 能 ”电路 把 来 自 双向 总 线 的 数据 放 到 所 有 触发 器 的 输入 。 不 过 当 MMY 发 出 时 钟 脉冲 时 ， 
它 连接 的 四 个 AND 门 中 有 三 个 将 会 禁止 脉冲 到 达 它 们 所 在 的 行 ， 脉 冲 只 能 到 达 “ 字 2” 那 
一 行 ， 所 以 这 是 能 存储 数据 的 唯一 的 触发 器 。 

市 场 上 有 几 种 类 型 的 内 存 芯片 ， 图 11-42 中 的 电路 模型 与 称 为 静态 内 存 (static memory) 
或 SRAM 的 内 存 是 最 为 相似 的 。 实 际 上 ， 主 从 D 触发 器 并 不 是 位 存储 器 的 基础 ， 因 为 它 使 
用 了 不 必要 的 晶体 管 。 许 多 静态 RAM 设备 使 用 的 电路 是 对 图 11-1b 的 修改 ， 即 一 个 由 一 对 
带 反 馈 的 反 相 器 组 成 的 稳定 电路 ， 它 只 需 两 个 额外 的 品 体 管 来 实现 设置 状态 的 机 制 。 静 态 
RAM 的 优势 是 速度 ， 但 由 于 每 个 位 单元 都 需要 几 个 晶体管 ， 因 此 劣势 是 芯片 尺寸 。 

为 了 克服 静态 内 存 尺 寸 的 劣势 ， 动 态 内 存 (dynamic memory) 或 DRAM 的 每 个 位 单元 
只 使 用 一 个 晶体 管 和 一 个 电容 ， 通 过 在 电容 上 存储 电荷 来 存储 数据 。 由 于 这 种 位 单元 的 尺寸 
小 ， 因 此 DRAM 芯片 的 存储 容量 要 比 SRAM 芯片 大 很 多 。DRAM 的 问题 在 于 电容 中 的 电 
荷 在 充满 几 毫 秒 之 后 会 慢 慢 泄漏 ， 在 过 多 的 电荷 泄漏 之 前 ， 内 存 子 系统 必须 要 从 单元 读 取 数 
据 ， 如 有 必要 还 要 给 电容 充 回电 荷 。 和 预期 的 一 样 ， 刷 新 操作 要 花费 时 间 ， 所 以 DRAM 内 
存 要 比 SRAM 内 存 慢 。 

相 比 于 读 / 写 内 存 ， 只 读 内 存 (read-only memory) 或 ROM 用 于 存储 不 会 改变 的 数据 。 
在 工厂 生产 时 ， 芯 片 的 每 个 位 单元 的 数据 就 设置 好 了 ， 这 种 情况 下 用 户 向 厂商 提供 要 存储 的 
位 模式 。 除 此 之 外 ， 还 有 可 编程 ROM (programable ROM) 或 PROM 芯片 ， 人 允许 用 户 编 写 
位 模式 。 这 个 过 程 通过 有 选择 地 断 开 内 徐 在 芯片 内 的 一 组 保险 丝 来 完成 ， 是 不 可 逆转 的 。 为 
了 解决 不 可 道 转 这 个 劣势 ， 可 擦 写 PROM (erasable PROM) 或 EPROM 可 以 通过 把 电路 曝 
光 在 紫外 线 下 擦 除 整个 芯片 。EPROM 芯片 封装 在 一 个 透明 窗口 下 ， 这 样 电路 可 以 暴露 在 射 
erp, BRR EPROM 芯片 就 必须 把 它 从 计算 机 中 拿 出 来 进行 曝光 ， 然 后 对 整个 芯片 重新 编 
fi. &F TH PROM (electrically erasable PROM) 或 EEPROM 允许 用 户 用 合适 的 电子 信 
号 组 合 来 擦 除 单个 单元 ， 这 样 就 不 用 把 设备 取出 来 ， 也 不 用 重新 编程 。 对 单元 进行 编程 的 电 
路 使 用 的 电压 不 同 于 在 芯片 正常 操作 期 间 读 取 数据 的 电压 ， 因 此 设计 起 来 会 更 加 复杂 。 

SRAM 和 DRAM 是 易 失 的 ， 也 就 是 说 关 掉 电路 的 电源 时 ， 数 据 就 会 丢失 。ROM 设备 
是 非 易 失 的 ， 因 为 它们 维持 数据 不 需要 外 部 电源 。 闪 存 (flash memory) 在 手持 消费 设备 中 
是 非常 受 欢 迎 的 ， 它 是 一 种 EEPROM， 具 有 设备 掉 电 后 仍然 保持 数据 这 个 优势 。 对 于 闪存 ， 
用 户 可 以 读 取 单个 单元 , 但 是 只 能 写 和 整个 单元 块 。 在 写 单元 块 之 前 ， 必 须 将 其 完全 擦 除 。 
闪存 卡 由 一 组 闪存 芯片 组 成 ， 闪 存 驱 动 器 与 之 类 似 ， 只 是 接口 电路 使 其 看 上 去 像 一 块 硬盘 。 
但 它 实际 上 并 不 是 硬盘 ， 也 没有 移动 部 件 。 相 比 于 同样 大 小 的 硬盘 ， 闪 存 驱 动 器 速度 更 快 ， 
但 存储 的 数据 量 要 小 很 多 。 微 硬盘 和 闪存 技术 在 市 场 上 相互 竞争 ， 厂 商 现在 提供 封装 好 的 硬 
盘 ， 它 的 接口 使 它 表 现 得 如 同 闪 存 ， 你 可 以 把 它 插 入 数码 相机 来 替代 内 存 卡 。 现 在 有 看 上 去 
像 硬盘 的 闪存 和 看 上 去 像 闪存 卡 的 硬盘 ， 这 是 抽象 在 现实 中 得 以 运用 的 例证 。 


11.3.4 地址 译 码 


单个 内 存 芯片 通常 不 能 提供 整个 计算 机 所 需 的 主 存 ， 必 须 把 几 个 芯片 组 合成 内 存 子 系统 
才能 提供 足够 的 存储 能 力 。 大 多 数 计算 机 是 按 字 节 寻 址 的 ，Pep/9 也 是 一 样 。 像 图 11-41a HB 
样 的 芯片 对 于 这 样 的 机 器 来 说 是 非常 方便 的 ， 因 为 芯片 字 的 大 小 和 CPU 寻 址 单元 的 大 小 是 
一 致 的 。 
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不 过 ,假设 有 图 11-42 所 示 的 一 组 4x2 芯 片 ， 想 把 它 用 在 Pep/9 中 。 芯 片 的 字 大 小 为 
2, CPU 的 可 寻 址 单元 大 小 是 8， 所 以 必须 把 四 个 4x2 的 芯片 组 合 构 成 一 个 4x8 的 内 存 模 


块 。 图 11-46 给 出 了 连接 方式 ， 可 以 看 到 这 个 模块 的 输入 和 输出 线 与 一 个 4x8 芯片 的 输入 / 
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输出 线 是 完全 一 样 的 。 内 存 中 每 个 字 节 的 位 分 布 在 四 个 芯片 上 ， 地 址 Al A0=01 的 字 节 的 每 
个 位 存储 在 所 有 四 个 芯片 的 第 二 行 ( 字 1 )。 


A0 -和 
Al > 


CS WE OE 
a) 框图 





图 11-46 从 四 个 4x2 的 内 存 芯片 构造 一 个 4x8 的 内 存 模块 


类 似 地 ， 要 构建 一 个 512 x 8 的 内 存 模块 就 需要 8 个 图 11-41b 所 示 的 芯片 。 为 了 获得 高 
可 靠 性 ， 单 元 为 八 位 需要 使 用 11 个 芯片 ， 三 个 额外 的 芯片 用 于 纠正 一 位 错误 编码 ， 如 同 9.4 
节 描 述 的 那样 。 对 于 这 样 的 ECC 系统 ， 每 个 字 节 的 位 将 会 分 布 于 11 个 芯片 。 

这 些 例子 展示 了 怎样 把 几 个 nx m 芯片 组 合成 一 个 n xk 芯片 模块 ， 这 里 的 k 大 于 m，, 通 
常 来 说 ,必须 是 m 的 倍数 。 可 以 简单 地 把 kim 个 芯片 所 有 公用 的 地 址 线 和 控制 线 连接 起 来 ， 
把 每 个 芯片 的 数据 线 分 配给 模块 的 数据 线 。 

构建 内 存 子 系统 的 另 一 个 问题 是 ， 现 有 几 个 nxm iiH, m 等 于 CPU 可 寻 址 单元 的 大 
小 ， 想 构建 一 个 1x m 的 模块 ， 这 里 的 1 大 于 n。 换 名 话说 ， 如 果 有 一 套 芯 片 ， 它 的 字 大 小 等 
于 CPU 可 寻 址 单元 的 大 小 ， 怎 样 连接 它们 并 把 内 存 加 到 计算 机 中 呢 ? 关键 是 要 使 用 芯片 选 
择 线 CS， 使 得 来 自 CPU 的 所 有 地 址 请 求 只 能 选择 一 个 芯片 。 把 内 存 芯片 连接 到 地 址 总 线 的 
技术 叫 作 地 址 译 码 ， 它 有 两 种 类 型 : 全 地 址 译 码 和 部 分 地 址 译 码 。 

图 11-47 展示 的 是 一 个 有 8 条 地 址 线 、 能 存储 2 BK 256 字 节 的 CPU 内 存 映射 ， 为 了 保 
持 例子 简单 ， 这 个 场景 小 得 不 切实 际 。 有 四 个 芯片 需要 连接 进 CPU 的 地 址 空间 : 安装 在 地 
址 0 的 64 字 节 RAM， 安装 在 地 址 64 的 32 字 节 RAM， 安 装 在 地 址 208 的 8 端口 IO 芯片 
和 安装 在 地 址 224 的 32 字 节 ROM. 





RAM RAM ROM 
8 端口 IO 芯片 
图 11-47 有 八条 地 址 线 的 256 字 节 内 存 映射 
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8 端口 内 存 映 射 IO 芯片 对 应 于 Pep/9 中 charin 和 charOut 处 的 输入 和 输出 设备 。 实 际 
E, EA no 设备 都 会 通过 内 存 与 控制 寄存 器 和 数据 寄存 器 进行 通信 。 例 如 ， 在 图 11-47 
中 ， 键 盘 的 控制 寄存 器 可 能 位 于 芯片 的 地 址 000 处 ， 其 数据 寄存 器 位 于 地 址 001 处 。 如 果 芯 
片 连接 到 内 存 映 射 的 地 址 208， 那 么 CPU 就 会 看 到 键盘 的 控制 寄存 器 在 地 址 208 处 ， 而 其 
数据 寄存 器 就 在 地 址 209 处 。 它 就 可 以 对 地 址 208 的 控制 寄存 器 执行 LDBA 来 检测 是 否 有 
按键 被 按 下 ， 如 果 是 ， 就 再 对 地 址 209 执行 LDBA 以 便 从 键盘 缓冲 区 获取 ASCII 字符 。 为 
使 内 存 映射 IO 正常 工作 ， 系 统 需 要 电路 能 检测 VO 设备 映射 到 的 内 存 地 址 的 装 人 和 存储 是 
否 已 经 完成 。 检 测 这 类 事件 会 激活 必要 的 电路 来 控制 IO 设备 。 

可 以 根据 图 11-48 的 表 来 确定 怎样 将 芯片 连接 到 地 址 总 线 。 对 于 每 个 芯片 ， 以 二 进 制 写 
出 最 小 的 地 址 ， 即 芯片 起 始 字 节 的 地 址 ， 和 最 大 地 址 ， 即 芯片 最 后 一 个 字 节 的 地 址 。 比 较 这 
两 个 位 模式 ， 就 可 以 确定 每 个 芯片 对 应 地 址 范围 的 通用 格式 。 例 如 ，8 端口 IO 芯片 的 通用 
地 址 是 1101 0xxx， 这 表示 对 应 的 地 址 范围 从 1101 0000 到 1101 0111， 每 个 字母 x 可 以 是 0 
也 可 以 是 1， 所 以 当 且 仅 当 前 $ 位 数字 是 11010 时 ， 选 中 的 一 定 是 这 个 8 端口 IO 芯片 。 





最 小 地 址 0000 0000 0100 0000 1101 0000 1110 0000 
最 大 地 址 nm odun nd iain 
通用 地 址 OOxx XXXX 010x xxxx 1101 0xxx 111x xxxx 


图 11-48 ”对 图 11-47 中 内 存 映 射 做 地 址 译 码 的 表格 


图 11-49 展示 的 是 用 全 地 址 译 码 方式 把 芯片 连接 到 地 址 总 线 。8 端口 IO 的 三 条 地 址 线 
连接 到 地 址 总 线 的 三 条 最 低位 线 上 ，5 条 最 高 地 址 线 通 过 一 对 反 相 器 和 一 个 AND TIEA T 
片 选择 端 (图 中 对 反 相 器 做 了 简化 ， 显 示 成 AND 门 的 反 相 输 入 )。 从 这 个 电路 可 以 看 出 ， 当 
且 仅 当 总 线 上 地 址 的 前 五 位 为 11010 时 , 该 8 端口 LO 芯片 的 世 片 选择 线 将 会 是 1。 


图 11-49 对 图 11-47 中 内 存 映射 做 全 地 址 译 码 
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为 了 保持 图 的 简洁 ,在 图 中 没有 显示 芯片 的 数据 线 。RAM 和 ROM 芯片 的 数据 线 都 连 
接 一 个 8 位 双向 数据 总 线 。 图 中 也 没有 显示 控制 输入 WE 和 OE， 它 们 连接 内 存 模 块 公用 的 
WE fil OE. 

如 果 知 道 某 个 内 存 子 系统 绝 不 会 通过 增加 更 多 内 存 进 行 升级 ， 那 么 就 可 以 使 用 部 分 地 址 
译 码 。 典 型 的 场景 是 一 个 小 型 的 不 支持 用 户 升级 的 计算 机 控制 装置 ， 它 的 主要 思想 是 在 译 码 
电路 中 把 门 的 数量 减少 到 刚好 满足 系统 访问 设备 的 需要 。 

这 种 简化 技术 就 是 写 出 芯片 的 通用 地 址 ， 每 行 一 个 ， 然 后 检查 列 。 对 于 图 11-48 中 的 芯 
片 ， 通 用 地 址 为 

00xx xxxx, 64 x 8 RAM 

010x xxxx, 32 x 8 RAM 

1101 Oxxx, 8-port I/O chip 

111x xxxx, 32 x 8 ROM 

来 看 看 第 一 个 芯片 ， 检 查 通用 地 址 的 列 ， 看 如 何 用 最 少量 的 信息 来 唯一 确定 第 一 个 芯 
片 。 可 以 看 到 第 一 个 芯片 的 第 二 列 对 应 地 址 线 A6 为 0， 其 他 芯片 的 该 位 为 1， 因此 不 管 A7 
的 值 是 什么 ， 只 要 A6 为 0， 就 可 以 选择 第 一 个 芯片 。 

现在 来 看 第 二 个 芯片 ， 若 用 全 地 址 译 码 就 必须 测试 三 条 地 址 线 : A7、A6 和 A5。 只 测 
试 两 条 可 以 吗 ? 例如 ， 能 测试 A7 A5=00 吗 ? 不 能 ， 因 为 A7 A6 A5=000 将 会 选择 第 一 个 芯 
片 ， 那 么 会 同时 选择 两 个 芯片 。 能 测试 A6 A5=10 吗 ? 不 能 ， 因 为 A7 A6 AS A4 A3=11010 
会 选择 8 端口 IO 芯片 ， 又 有 冲突 。 不 过 ， 通 过 观察 所 有 列 可 以 发 现 没 有 其 他 芯片 的 前 两 位 
为 01， 因 此 可 以 通过 测试 A7 A6=01 来 选择 第 二 个 芯片 

通过 类 似 的 推理 可 以 看 到 ， 可 测试 A7 A6 AS=110 10 来 选择 第 三 个 芯 , Wit A7 A6 
A5=111 来 选择 第 四 个 芯片 。 图 11-50 展示 了 简化 的 最 终结 果 。 相 比 于 图 11-49， 我 们 去 掉 了 

一 个 两 输入 AND 门 和 三 个 反 相 器 ， 将 一 个 AND 门 的 输入 从 3 个 减少 到 2 个 ， 另 一 个 AND 
门 的 输入 从 5 个 减少 到 3 个 。 





图 11-50 对 图 11-47 中 内 存 映 射 做 部 分 地 址 译 码 
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这 自然 会 产生 一 个 问题 ; 图 11-49 和 图 11-50 的 内 存 模 块 行为 有 什么 不 同 ? 当 CPU 访问 
图 11-47 内 存 映 射 的 阴影 区 域 之 一 时 ,没有 任何 不 同 。 使 用 全 地 址 译 码 时 ， 如 果 CPU 访问 
阴影 区 域 之 外 的 地 址 ， 则 没有 芯片 被 选中 ， 数 据 总 线 上 的 数据 是 不 可 预测 的 。 然 而 使 用 部 分 
地 址 译 码 ，CPU 可 能 会 访问 某 个 芯片 。 

来 看 64x8 位 的 RAM， 它 的 通用 地 址 为 00xx xxxx， 如 果 A6 为 0， 它 会 被 选中 ， 分 为 
两 种 情况 : 地 址 请 求 为 00xx xxxx 和 10xx xxxx。 第 一 个 地 址 范围 是 设计 好 的 ， 但 是 第 二 个 
地 址 范围 是 部 分 地 址 译 码 的 副作用 ， 实 际 上 是 把 一 个 物理 设备 映射 到 地 址 空间 的 两 个 区 域 ， 
CPU 在 地 址 0 和 128 看 到 的 是 一 个 芯片 的 克隆 。 类 似 的 推理 显示 32x8g 位 RAM 在 地 址 96 
又 复制 了 一 次 ，8 端口 IO 芯片 在 三 个 地 方 进行 了 复制 。ROM 没有 复制 ， 因 为 对 于 全 地 址 和 
部 分 地 址 译 码 ， 它 的 地 址 译 码 电路 是 一 样 的 。 图 11-51 展示 的 是 部 分 地 址 译 码 的 内 存 映射 。 





8 端口 IO 芯片 
图 11-51 对 图 11-49 进行 部 分 地 址 译 码 的 内 存 映 射 


使 用 部 分 地 址 译 码 时 必须 小 心 。 在 这 个 例子 中 ， 芯 片 以 无 缺口 、 无 重复 、 完 全 填充 内 存 
映射 的 方式 进行 复制 。 如 果 你 的 译 码 在 得 到 的 映射 中 留 下 缺口 ， 这 不 会 带 来 什么 危害 。 如 果 
CPU 访问 的 是 缺口 区 域 ， 那 么 没有 芯片 会 被 选中 。 然 而 如 果 你 的 译 码 产生 了 重复 ， 那 就 意 
味 着 如 果 CPU 要 访问 地 址 空间 的 这 个 区 域 ， 那 么 会 有 多 个 芯片 被 选中 ， 这 对 系统 是 有 害 的 。 
当然 ， 可 以 假设 CPU 绝对 不 会 访问 这 个 区 域 ， 就 像 它 可 以 访问 真正 的 芯片 就 不 会 访问 复制 
的 芯片 一 样 。 但 是 怎么 可 以 假设 程序 中 不 会 有 错误 呢 ? 


11.3.5” 双 端口 寄存 器 组 


在 前 一 节 介 绍 的 所 有 内 存 子 系统 中 ， 一 组 地 址 线 对 应 的 都 只 有 一 组 数据 线 ， 这 种 组 织 结 
构 对 于 计算 机 主 存 子 系统 来 说 是 合适 的 ， 因 为 主 存 和 CPU 通常 不 在 同一 集成 电路 上 。 图 4-2 
展示 的 是 Pep/9 CPU 中 的 寄存 器 ， 它 们 的 组 织 结构 很 像 内 存 子 系统 ， ieee 
存 器 组 里 面 。CPU 中 的 寄存 器 组 在 以 下 两 方面 不 同 于 内 存 芯 片 的 存储 结 
e 数据 总 线 是 单 向 而 不 是 双向 的 
e 有 了 两 个 而 不 是 一 个 输出 端口 
图 11-52 展示 的 是 地 址 从 0 一 31 的 32 个 8 位 寄存 器 ,前 5 个 寄存 器 对 ISA 层 的 程序 员 
是 可 见 的 。 每 个 16 位 寄存 器 分 成 两 个 8 位 寄存 器 ， 这 种 划分 对 机 器 层 的 程序 员 是 不 可 见 的 。 
其 余 寄 存 器 (地址 从 11 一 31) 对 机 器 层 程序 员 是 不 可 见 的 。 寄 存 器 11 ~ 21 用 于 存储 
临时 变量 ; 寄存 器 22 ~ 31 是 包含 定 值 的 只 读 寄 存 器 ， 类似 于 ROM， 如 果 想 存储 ， 寄 存 器 
中 的 值 不 会 改变 ， 这 些 常量 值 以 十 六 进 制 给 出 。 只 读 寄 存 器 实际 上 不 是 时 序 电路 ， 因 此 没有 
用 阴影 表示 。 它 们 没有 可 以 改变 的 状态 ， 因 此 更 像 是 组 合 电路 。 
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11-52 Pep/9CPU 中 的 32 个 8 位 寄存 器 


主 存 芯 片 有 一 组 地 址 线 和 一 组 双向 数据 线 ， 而 寄存 器 组 有 三 组 地 址 A、B 和 C， 以 及 
三 条 单 向 数据 总 线 ABus、BBus 和 CBus，ABus 和 BBnus 是 两 个 输出 端口 ，CBus 是 输入 端 
口 。 每 条 数据 总 线 都 是 8 位 宽 ， 每 组 地 址 线 都 包含 5 条 线路 ， 能 够 访问 2° 个 寄存 器 中 的 任 
何 一 个 。 要 把 一 个 值 存 储 到 寄存 器 中 ， 就 要 把 寄存 器 的 地 址 放 到 C 上 ， 把 待 存储 的 数据 放 
到 CBus 上 ， 给 标记 为 LoadCk 的 控制 线 时 钟 信号 。 通 过 两 个 输出 端口 可 以 同时 读 取 两 个 不 
同 的 寄存 器 ， 可 以 把 一 个 地 址 放 在 A 上 ， 一 个 放 在 B 上 ,来 自 这 两 个 寄存 器 的 数据 将 同时 
出 现在 ABus 和 BBus 上 。 也 允许 把 同一 地 址 放 在 A 和 B 上 ， 这 样 来 自 同 一 个 寄存 器 的 数据 
将 出 现在 ABus 和 BBus 上 。 

图 11-53 展示 的 是 双 端 口 寄 存 器 组 的 实现 。 输 入 遵循 和 主 存 芯 片 一 样 的 基础 组 织 结构 , 
C 的 5 条 地 址 线 使 译 码 器 的 一 条 输出 线 为 1， 其 余 为 0。CBus 连接 全 部 32 个 寄存 器 ， 当 
LoadCk 控制 线 有 脉冲 时 ，CBus 上 的 值 就 随时 钟 信号 存 人 某 一 个 寄存 器 中 。 


C LoadCk 







8 32 输入 ABus 
复 用 器 => 


832 输入 BBus 
复 用 器 YY 


CBus 
图 11-53 11-52 中 双 端 口 寄 存 器 组 的 实现 
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两 输出 端口 由 两 个 32 路 输入 复 用 器 组 成 ， 每 路 可 以 发 送 8 位 的 量 。 每 个 复 用 器 是 一 组 
8 个 32 输入 复 用 器 ， 类 似 于 图 10-43 中 的 复 用 器 。A 的 5 条 线 连接 到 第 一 个 端口 中 所 有 8 个 
复 用 器 的 5 条 选择 线 。 第 一 个 复 用 器 负责 选择 和 传送 所 有 32 个 寄存 器 的 第 一 位 ， 第 二 个 复 
用 器 负责 选择 和 传送 所 有 32 个 寄存 器 的 第 二 位 ， 以 此 类 推 。 


本 章 小 结 


由 带 反馈 环 的 逻辑 门 构建 的 时 序 电路 可 以 记忆 状态 。 四 个 基本 时 序 设备 是 SR 触发 器 
(设置 、 重 置 )、JK 触发 器 、DD 触发 器 〈 数 据 或 延迟 ) 和 TT 触发 器 ( 反 转 )。SR 触发 器 的 S 输 
入 把 状态 设置 为 1，R 输入 把 状态 重 置 为 0，SR=11 这 种 输入 条 件 是 未 定义 的 。 除 了 定义 了 
JK=11 这 种 条 件 并 反 转 状态 外 ，JK 的 输入 与 SR 一 样 。D 输入 直接 传送 到 状态 。 如 果 T 了 输入 
为 1， 那 么 状态 反 转 ， 否 则 保持 不 变 。 每 种 触发 器 都 可 以 构造 成 主 从 设备 ， 以 解决 外 部 反馈 
引起 的 不 稳定 问题 。 

时 序 电 路 通常 由 一 个 组 合 电路 组 成 ， 该 组 合 电路 的 输出 反馈 到 一 组 状态 寄存 器 中 ， 状 态 
寄存 器 的 输出 又 反馈 到 组 合 电路 的 输入 。 可 以 用 状态 转换 图 来 描述 时 序 电路 的 特性 ， 状 态 转 
换 图 是 有 限 状 态 机 的 一 种 表现 形式 。 在 分 析 时 序 电路 时 ， 输 入 和 时 序 电路 是 给 定 的 ， 要 确定 
的 是 输出 。 

设计 时 序 电 路 则 是 给 定 输入 和 期 望 的 输出 ， 要 确定 时 序 电 路 。 激 励 表 可 以 帮助 进行 设 
计 。 触 发 器 的 激励 表 由 设备 四 种 可 能 的 状态 改变 (0 到 0、0 到 1、1 到 0、1 到 1) 以 及 产生 
改变 所 需 的 输入 条 件 组 成 。 设 计 过 程 包括 对 产生 给 定 状态 转换 图 所 必需 的 输入 条 件 制 表 ， 然 
后 设计 组 合 电路 来 生成 这 些 输入 条 件 。 

寄存 器 是 一 组 D 触发 器 。 三 态 缓冲 器 可 以 用 来 实现 双向 总 线 。( 从 概念 上 说 ) 内 存 芯片 
是 一 个 DD 触发 器 的 阵列 ， 有 一 组 地 址 线 、 数 据 线 和 控制 线 。 控 制 线 一 般 由 芯片 选择 (CS), 
写 使 能 (WE) 和 给 入 使 能 (OE) 组 成 。 地 址 译 码 是 一 种 使 用 CS 线 、 由 一 组 内 存 芯片 构建 内 
存 模块 的 技术 ， 部 分 地 址 译 码 会 把 选择 电路 中 门 的 数量 减 到 最 少 。Pep/9 CPU 中 的 双 端 口 寄 
存 器 组 实现 了 一 些 对 ISA 程序 员 可 见 的 寄存 器 ， 也 实现 了 对 ISA 程序 员 不 可 见 的 临时 寄存 
器 和 和 常量 寄存 器 。 


练习 


仁和 省 项 

*1. 在 什么 情况 下 ， 一 串 任 意 数量 的 、 带 反馈 环 的 反 相 器 (如 图 11-1 所 示 ) 会 形成 一 个 稳定 的 网 络 ? 

2. 构建 类 似 于 图 11-3 和 图 11-4 的 表 ， 说 明 如 果 SR 锁 存 器 的 起 始 状 态 为 Q=1， 则 及 变 为 1 又 变 回 0 
会 把 它 重 置 为 Q=0。 

. 在 图 11-10 中 定义 下 列 点 : (1) A 是 上 面 主 触发 器 AND 门 的 输出 。(2 ) B 是 下 面 主 触发 器 AND 门 
的 输出 。(3 ) C 是 反 相 器 的 输出 。 (4) D 是 上 面 从 锁 存 器 AND 门 的 输出 。(5 ) E 是 下 面 从 锁 存 器 
AND 门 的 输出 。 
假定 时 钟 脉 冲 到 达 前 SR=10，Q=0。 做 表 展 示 出 图 11-11 中 下 述 每 个 间隔 期 间 A、B、C、D、E、 
R2, S2, QAQ 的 值 ， 假 设 门 延 迟 为 0。 

*(a) t 之 前 

*(b) ti 和 ,之 间 
(ce) 和 4 之 间 
(d) t3 和 4 之 间 


we 
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(e) 所 之 后 

4. 时 钟 脉 冲 达 到 前 SR=01 和 Q=1 的 情况 下 再 做 一 遍 练习 3。 

5. 画 出 下 面 触 发 器 的 类 似 图 11-14 的 状态 转换 图 : 
(a) JK * (b) D (c) T 

6. 把 D 输入 替换 为 T， 画 出 工 触 发 器 的 类 似 图 11-20c 的 时 序 图 。 

7. 用 SR 触发 器 构建 T 触 发 器 。 

8. 本 节 展 示 了 怎样 用 SR 触发 器 和 一 些 门 构建 区 触发 器 和 了 触发 器 。 实 际 上 任何 触发 器 都 可 以 用 其 
他 触发 器 和 一 些 门 来 构成 。 用 JK 触发 器 构建 下 面 的 触发 器 : 


*(a) D (b) SR (c) T 
用 DD 和 触发 器 构建 下 面 的 触发 器 : 
(d) SR (e) JK (f) T 
用 工 触 发 器 构建 下 面 的 触发 器 : 
(g) SR (h) JK (i) D 
11.2% 


9. 图 11-10 是 SR 主 从 和 触发 器 的 实现 ， 把 它 修改 为 可 提供 如 图 11-32 所 示 的 异步 预 设置 和 清除 输入 。 
当 预 设置 和 清除 都 为 0 时 ， 设 备 应 该 正常 运行 ; 当 预 设置 为 1 时， 主 触发 器 的 状态 Q2 和 从 触发 器 
的 状态 Q 都 被 强制 为 0， 无 论 时 钟 是 0 还 是 1。 当 清除 为 1 时 ， 主 状态 Q2 和 从 状态 Q 都 被 强制 为 
0。 可 以 假设 预 设置 和 清除 不 会 同时 为 1。 如 果 假 设 现 有 的 AND 和 OR 门 有 三 个 输入 而 不 是 两 个 输 
和信， 那么 在 设计 电路 时 可 以 不 使 用 额外 的 门 。 

10. 一 个 时 序 电 路 有 两 个 JK 触发 器 FFA 和 FFB， 两 个 输入 X1 和 X2， 触 发 器 输入 为 
JA=X1 B JB=X1 A 
KA=X2 + X1 AB KB=X2 +XIA 
除了 触发 器 状态 外 没有 其 他 输出 。 画 出 它 的 时 序 电路 的 逻辑 图 和 状态 转换 图 。 

.一 个 时 序 电 路 有 一 个 下 触发 器 FFA， 一 个 T 触 发 器 FFB， 一 个 输入 X， 触 发 器 输入 为 
J=X@B T=X@A 
K= XB 
输出 为 Z=A B。 夯 出 它 的 时 序 电 路 的 逻辑 图 和 状态 转换 图 。 

12. 一 个 时 序 电路 有 两 个 SR 触发 器 FFA 和 FFB， 两 个 输入 Xl 和 X2， 触 发 器 输入 为 
SA= XIl SB =X1 X2A 
RA= XI X2 RB =X1A+ X2 
输出 为 Z=X1A。 画 出 它 的 时 序 电路 的 逻辑 图 和 状态 转换 图 。 

13. 用 下 列 触发 器 设计 图 11-33 的 时 序 电路 
*(a)D (b) T 

14. 图 11-54 是 一 个 有 三 个 触发 器 和 一 个 输入 的 时 序 电路 的 状态 转换 图 。 输 入 为 1 时 以 二 进 制 加 1， 输 
入 为 0 时 保持 状态 不 变 。 用 下 面 的 触发 器 设计 电路 并 画 出 逻辑 图 : 

(a) JK (b) SR (c) D (d) T 


图 11-54 练习 14 的 状态 转换 图 


一 
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15. 图 11-55 是 一 个 有 三 个 触发 器 和 一 个 输入 的 时 序 电路 的 状态 转换 图 。 输 入 为 1 时 以 二 进 制 加 1， 输 
人 为 0 以 二 进 制 减 1。 用 下 面 的 触发 器 设计 电路 并 画 出 逻辑 图 : 
*(a) JK (b) SR (c) D (d) T 





图 11-55 练习 15 的 状态 转换 图 


16. 图 11-56 是 一 个 有 两 个 触发 器 和 两 个 输入 的 时 序 电路 的 状态 转换 图 。 和 输入 为 01 时 以 二 进 制 加 1， 
输入 为 10 以 二 进 制 减 1， 输 入 为 00 时 状态 不 变 ， 输 入 11 绝对 不 会 发 生 ， 可 以 看 作 无 关 条 件 。 用 
下 面 的 触发 器 设计 电路 并 画 出 逻辑 图 : 

(a) JK (b) SR (c) D (d) T 





图 11-56 练习 16 的 状态 转换 图 


17. 图 11-57 是 一 个 有 三 个 触发 器 和 一 个 输入 的 时 序 电 路 的 状态 转换 图 ， 它 是 一 个 三 位 右 移 寄存 器 。 输 
人 为 0 时 , 将 0 移入 最 高 有 效 位 。 输 入 为 1 时 , 将 1 移 人 最 高 有 效 位 。 用 下 面 的 触发 器 设计 电路 并 
画 出 逻辑 图 : 

(a) JK (b) SR (c) D (d) T 





图 11-57 练习 17 的 状态 转换 图 


18. 一 个 时 序 电 路 有 6 个 状态 寄存 器 和 三 条 输入 线 。 
(a) 它 有 多 少 种 状态 ? 
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(b) 每 个 状态 有 多 少 种 转换 ? 
(c) 总 共有 多 少 种 转换 ? 
143% 
19.(a) 图 11-42 的 内 存 芯 片 里 有 多 少 个 AND 门 ， 多 少 个 OR 门 ， 多 少 个 反 相 器 ? 包括 译 码 器 中 的 门 ， 
但 是 不 包括 D 触发 器 中 的 门 。 

(b) 图 11-41a 的 内 存 芯片 中 每 种 门 有 多 少 个 ? 

(c) 图 11-41b 的 内 存世 片 中 呢 ? 

20. 在 实际 中 ， 内 存 芯片 的 芯片 选择 线 为 低 电 平 ， 这 条 线 标记 为 CS 而 不 是 CS。 如果 所 有 芯片 上 的 芯 

片 选择 线 都 为 低 电 平 有 效 ， 图 11-49 会 怎样 改变 ? 

21. 一 个 计算 机 系统 的 数据 总 线 是 16 位 宽 。 

(a) 如 果 有 一 盒 1Kix 1 动态 RAM 芯片 ， 这 人 台 计 算 机 最 少 有 多 少 内 存 字 节 ? 

(b) 如 果 将 1KiB 芯片 配置 成 256 x 4 的 设备 ， 那 么 (a) 中 问题 的 答案 又 是 怎样 ? 

22. 有 一 个 10 位 地 址 总 线 的 小 型 CPU。 需 要 连接 一 个 64 字 节 PROM、 一 个 32 字 节 的 RAM 和 一 个 有 

两 条 地 址 线 的 4 端口 IO 芯片 。 所 有 芯片 的 芯片 选择 为 高 电 平 有 效 。 

(a) 给 出 使 用 全 地 址 译 码 时 的 连接 ，PROM 在 地 址 0，RAM 在 地 址 384, PIO 在 地 址 960. (这 些 地 
址 都 是 十 进 制 表 示 的 。) 

(b) 芯片 还 是 位 于 同样 的 位 置 ， 给 出 使 用 部 分 地 址 译 码 时 的 连接 。 给 出 使 用 部 分 地 址 译 码 时 的 内 存 
映射 ， 确 保 没 有 区 域 重 琶 。 对 于 每 个 芯片 ， 请 说 明 (1 ) 产生 了 多 少 克隆 芯片 ? (2 ) 每 个 克隆 
芯片 的 起 始 地 址 。 

23. 说 明 图 11-53 上 部 的 每 个 复 用 器 是 怎样 连接 的 。 可 以 使 用 省 略 号 C.) 
24. 图 11-53 的 双 端 口 寄存 器 组 有 多 少 个 AND 门 ， 多 少 个 OR 门 ， 多 少 个 反 相 器 ? 包括 构建 译 码 器 和 

复 用 器 所 需要 的 门 ， 但 不 包括 组 成 寄存 器 的 D 触发 器 中 的 门 。 
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本 书 最 后 一 章 介绍 LG1 层 组 合 电路 和 时 序 电路 与 IJSA3 层 机 需 之 间 的 关联 ， 讲 述 如 何 连 
BE Mc2 抽象 层 的 硬件 设备 以 形成 较 高 抽象 层次 上 的 黑 盒 子 ， 最 终 构 造 出 Pep/9 计算 机 。 


12.1 构建 一 个 1SA3 层 机 器 


图 12-1 是 Pep/9 计算 机 的 框图 ， 
可 以 看 出 CPU 分 成 数据 区 和 控制 区 。 磁盘 CPU 


数据 区 从 主 存 子 系统 和 磁盘 接收 数据 
并 向 它们 发 送 数据 ， 控 制 区 向 数据 区 数据 区 | 控制 区 


和 计算 机 的 其 他 部 分 发 送 控制 信号 。 











12.1.1 CPU 数据 区 





一 一 > 数据 流 
图 12-2 是 Pep/9 CPU 的 数据 区 。 ~~~ 控制 
图 中 的 时 序 设 备 标 上 了 阴影 ， 以 区 别 图 12-1 Pep/9 计算 机 的 框图 


于 组 合 设 备 。 图 顶部 的 CPU 寄存 器 与 
图 11-52 的 双 端 口 寄存 器 组 一 致 。 

图 12-2 中 没有 给 出 的 控制 区 在 数据 区 的 右边 ， 从 右边 来 的 控制 线 就 发 自控 制 区 。 控 制 
线 在 图 12-1 中 用 虚线 表示 ， 在 图 12-2 中 用 实 线 表示 。 有 两 类 控制 信号 : 组 合 电路 控制 和 
时 钟 脉冲 。 所 有 时 钟 脉冲 的 名 字 都 以 Ck 结尾 ， 用 来 使 数据 随 着 时 钟 进入 寄存 器 或 触发 器 。 
例如 ，MDRCk 是 MDR 的 时 钟 输入 。 当 有 脉冲 到 达 时 ,来 自 MDRMux 的 输入 随时 钟 进入 
MDR。 

图 12-2 左边 的 总 线 就 是 图 12-1 中 的 主 系统 总 线 ， 主 存 和 JIO 设备 都 连接 到 总 线 上 。 
它 包括 8 条 双向 数据 线 、16 条 地 址 线 和 2 条 控制 线 2 条 控制 线 在 图 的 底部 分 别 标识 为 
MemWrite 和 MemRead, MAR 是 内 存 地 址 寄存 器 ， 它 分 为 两 部 分 : 高 位 字 节 MARA 和 低 
位 字 节 MARB。 标 号 为 “MeM ”的 方 框 是 一 个 64KiB 的 内 存 系 统 。 总 线 的 16 位 地 址 线 是 
单 向 的 ， 所 以 MAR 的 输出 通过 总 线 连接 到 内 存 子 系统 的 地 址 端口 输入 上 。MDR 是 8 位 内 
存 数据 寄存 器 。 数 据 总 线 是 双向 的 ， 所 以 在 MDR 和 总 线 之 间 有 一 组 八 个 三 态 缓冲 器 (图 中 
REE), H MemWrite 控制 线 使 能 。 通 过 主 系统 总 线 ，MemWrite RFI MemRead 线 分 别 与 
内 存 子 系统 的 “ 写 使 能 ”( WE) 线 和 “输出 使 能 ”( OE) 线 相 连 。 图 12-2 中 所 有 其 他 用 宽 箭 
头 表示 的 总 线 都 是 八 位 单 向 数据 总 线 ， 包 括 ABus、BBus、CBus 和 把 主 系统 总 线 的 数据 线 
连接 到 标号 为 MDRMux 的 方 框 的 总 线 。 

每 个 复 用 器 (AMux 、CMux 和 MDRMux) 都 是 一 组 八 个 二 输入 复 用 器 ， 它 们 的 控制 线 
连接 到 一 起 形成 图 12-2 中 的 一 条 控制 线 。 例 如 ， 图 中 标号 为 AMux 的 控制 线 同时 连接 到 标 
号 为 AMux 的 方 框 中 八 个 复 用 器 组 的 八条 控制 线 。 复 用 器 控制 线 会 按照 如 下 方式 让 信和 号 通 


HBiI2E HMAK 461 


过 复 用 器 : 
e 复 用 器 控制 线 为 0， 则 左边 的 输入 通过 到 输出 。 
e 复 用 带 控 制 线 为 1， 则 右边 的 输入 通过 到 输出 。 
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图 12-2 Pep/9 CPU 的 数据 区 


例如 ， 如 果 MDRMux 控制 线 为 0， 则 MDRMux 会 把 系统 总 线 的 内 容 送 到 MDR ; 如 果 
控制 线 为 1， 就 把 CBus 的 数据 送 到 MDR。 类 似 地 ， 如 果 AMux 控制 线 为 0，AMux 会 把 
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MDR 的 内 容 送 到 ALU 的 左边 输入 ; 否则 就 把 来 自 ABus 的 数据 送 到 ALU 的 左边 输入 。 

CSMux 与 其 他 多 路 复 用 器 不 同 ， 它 只 切换 一 条 线 ， 而 不 是 8 条 线 。 如 果 CSMux 控制 线 
为 0， 多 路 复 用 器 就 把 S 位 发 送 到 ALU 的 Cin 端 如 果 CSMux 控制 线 为 1， 多 路 复 用 器 就 
把 C 位 发 送 到 ALU 的 Cin 端 。 

标号 为 ALU 的 方 框 是 图 10-54 的 算术 逻辑 单元 ， 通 过 图 12-2 中 标号 为 ALU 的 四 条 控 
制 线 ， 提 供 图 10-55 列 出 的 16 种 功能 。 状 态 位 (N、Z、V 和 C) 每 个 都 是 一 个 DD fh & GE 
例如 ， 标 号 为 C 的 方 框 是 一 个 D 触发 器 ， 存 储 进 位 位 的 值 。 该 触发 器 的 D 输入 来 自 ALU 
的 Cout 信号 ; 触发 器 的 Q 输出 既 在 顶部 也 在 底部 ， 顶 部 的 线 连 接 进 入 ALU 的 Cin 输入 ; 
触发 器 的 时 钟 输入 是 标号 为 CCk 的 控制 信号 。 每 个 状态 位 的 输出 都 反馈 到 进入 CMux 左边 
总 线 的 低 四 位 字 节 ， 高 四 位 固化 设置 为 0。 每 个 状态 位 的 输出 同时 送 到 控制 区 。 

标号 为 S$ 的 方 框 是 影子 进位 位 。 作 为 ISA3 层 的 进位 位 ，C 位 是 程序 员 可 见 的 。 算 术 指 
令 设 置 C 位 ， 而 条 件 分 支 指令 测试 C 位 。 但 是 在 ISA3 抽象 层 上 ， 影 子 进位 位 S 对 程序 员 
是 不 可 见 的 。 当 ALU 执行 一 个 算术 运算 操作 时 ， 它 可 以 通过 CSMux MC 位 或 $ 位 得 到 其 
Cin 输入 。 而 系统 也 可 以 把 ALU 的 Cout 输出 随时 钟 送 到 C 位 或 $ 位 。 有 具体 是 哪个 位 则 依赖 
于 Mc2 层 上 的 计算 是 否 会 改变 ISA3 层 上 的 程序 进位 。 如 果 计 算 执 行 的 是 像 ADDA 这 样 的 
算术 运算 ， 就 应 该 设置 进位 位 ,那么 ALU 的 Cout 就 要 随时 钟 送 到 C 进位 位 。 如 果 计 算 执 
行 的 是 内 部 操作 ， 比 如 递增 程序 计数 器 ,那么 ALU 的 Cout 就 要 随时 钟 送 到 S 影子 进位 位 。 

在 ISA 层 ， 每 个 寄存 器 都 是 16 位， 但 是 CPU 的 内 部 数据 通路 只 有 8 位 宽 。 要 执行 16 
位 数字 的 运算 ， 在 Mc2 层 就 需要 两 个 8 位 
数字 的 运算 。 例 如 ， 如 果 结 果 的 16 位 都 为 
0， 那 么 Z 位 就 必须 设置 为 1， 也 就 是 两 个 8 
位 运算 的 ALU 的 Zout 信 号 都 为 1。 标 号 为 
ANDZ 的 组 合 电路 框 帮助 计算 Z 位， 其 输出 
是 Z 位 的 D 触发 器 的 输入 ， 它 有 三 个 输入 : 
来 自控 制 区 的 ANDZ 输 入 ， 来 自 ALU 的 
Zout 输 出 和 来 自 Z 位 的 DD 触发 器 的 Q 输出 。 
图 12-3 给 出 的 是 这 个 组 合 电路 框 的 真 值 表 ， 
它 有 两 种 运行 模式 : 

o 如 果 AndZ 控制 线 为 0， 则 Zout 直接 

通过 到 输出 。 
e 如果 Andz 控制 线 为 1， 则 Zout 和 Zz 图 12-3 图 12-2 所 示 组 合 电路 AndZ 的 真 值 表 
进行 AND， 结 果 送 到 输出 。 

因此 Z 位 要 么 加 载 自 ALU 的 Zout 信号 ， 要 么 加 载 自 Zout 信号 和 Z 位 当前 值 的 AND， 
选择 哪个 取决 于 来 自控 制 区 的 ANDZ 信号 。AndZ 电路 的 实现 作为 章 末 的 一 道 练习 。 

数据 流 是 一 个 大 循环 ， 从 顶部 的 32 个 8 位 寄存 器 开始 ， 经 过 ABus 和 BBus， 再 经 过 
AMux 到 ALU， 最 终 经 过 CMux 通过 CBus 回 到 32 个 寄存 器 组 。 来 自主 存 的 数据 也 可 以 通 
过 系统 总 线 加 入 这 个 循环 ， 通 过 MDRMux 到 MDR。 从 MDR 数据 可 以 经 过 AMux、ALU 
和 CMux 到 达 任 一 个 CPU 寄存 器 。 要 把 CPU 寄存 器 的 内 容 送 到 内 存 ， 可 以 通过 ABus 和 
AMux， 穿 过 ALU, CMux 和 MDRMux 进入 MDR, M MDR 可 以 经 过 系统 总 线 到 达 内 存 子 
系统 。 
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控制 区 有 34 条 控制 输出 线 和 12 条 输入 线 。34 条 输出 线 控制 数据 在 数据 区 里 的 流动 ， 
并 指明 要 发 生 的 处 理 。12 条 输入 线 是 来 自 BBus 的 8 条 线 ， 以 及 来 自 状态 位 的 4 条 线 ， 控 制 
区 可 以 测试 某 些 条 件 。 本 章 后 续 内 容 会 介绍 控制 区 如 何 产 生 适 当 的 控制 信号 。 为 了 介绍 数据 
区 是 如 何 工作 的 ， 现 在 假设 可 以 在 任何 时 刻 把 控制 线 设置 为 任何 想 要 的 值 。 


12.1.2 ” 冯 “' 诺 依 曼 周 期 


Pep/9 计算 机 的 核心 是 冯 ，: 诺 依 曼 周 期 。 图 12-2 中 的 数据 区 实现 了 冯 ， 诺 依 曼 周期 ， 它 
其 实 不 过 是 一 种 管道 系统 。 房 子 里 的 水 通过 各 种 龙头 和 阀门 控制 的 管道 ， 同 样 ， 信 号 (实际 
上 是 电子 ) 流 过 各 种 复 用 器 控制 的 总 线 线路 。 在 通路 上 ， 信 号 可 以 通过 ALU, 在 ALU 按照 
需求 对 数据 进行 处 理 。 本 节 介 绍 实现 汉 “ 诺 依 曼 周 期 所 需 的 控制 信号 ， 包 括 Pep/9 指令 集中 
某 些 典型 指令 的 实现 ， 其 他 指令 的 实现 作为 章 末 练 习 。 

图 4-32 是 在 ISA3 层 执行 程序 所 需 步 又 的 伪 代 码 描述 。do TAM ALIS - 诺 依 曼 周 期 。 在 
Mc2 层 ， 虽 然 指令 寄存 器 的 操作 数 指示 符 部 分 是 16 位 数字 ,但 实际 上 CPU 的 数据 区 是 对 8 
位 数字 进行 运算 。CPU 分 两 步 取 操作 数 指示 符 ， 先 取 高 位 字 节 再 取 低 位 字 节 ， 取 完 每 个 字 
节 之 后 ， 控 制 区 会 把 PC 加 1。 图 12-4 VS - 诺 依 曼 周 期 在 Mc2 层 的 伪 代 码 描述 。 


do { 


Fetch the instruction specifier at address in PC 
PC + PC + 1 
Decode the instruction specifier 
if (the instruction is not unary) { 
Fetch the high-order byte of the operand specifier as specified by PC 


PC & PC +1 
Fetch the low-order byte of the operand specifier as specified by PC 
PC & PC + 1 

} 


Execute the instruction fetched 
} 


while ( (thestop instruction does not execute) && (the instruction is legal) ) 
图 12-4 75) + PACE TAY) Mc2 层 伪 代 码 描述 


控制 区 把 控制 信号 发 到 数据 区 以 实现 汉 “' 诺 依 曼 周期 。 图 12-5 是 获取 指令 指示 符 和 PC 
加 1 的 控制 序列 。 图 中 没有 给 出 控制 区 确定 指令 是 否 是 一 元 指令 的 方法 。 

12-5 中 的 每 一 个 有 编号 的 行 都 是 一 个 CPU 时 钟 周期 ， 由 一 组 控制 信号 组 成 ， 这 些 控 
制 信号 会 注入 组 合 设备 ， 通 常 跟 有 一 个 时 钟 脉 冲 进入 一 个 或 多 个 寄存 器 。 组 合 信号 用 等 号 表 
示 ， 其 持续 时 间 必 须 足 够 长 ， 使 得 数据 能 够 到 达 寄 存 器 ， 并 在 时 钟 的 控制 下 存 人 寄存 器 。 组 
合 信号 的 设置 是 并 发 的 ， 所 以 用 逗号 分 隔 开 ， 逗 号 就 是 并 发 分 隔 符 。 组 合 信号 和 时 钟 信号 用 
分 号 隔 开 ， 分 号 是 时 序 分 隔 符 ， 因 为 时 钟 脉冲 是 在 设置 了 组 合 信号 之 后 才 施加 的 。 注 释 用 双 
RHI (//) 表示 。 

12-6 给 出 的 时 钟 周期 对 应 于 图 12-5 中 编号 1 ~ 5 的 行 。 以 秒 为 单位 的 时 钟 周期 了 是 
由 以 Hz 为 单位 的 系统 时 钟 频 率 f 决 定 的 ，7=1/f。 在 所 有 其 他 条 件 不 变 的 情况 下 ,计算 机 的 
频率 越 高 (以 GHz 为 单位 进行 衡量 )， 一 个 时 钟 周期 的 时 间 就 越 短 ， 计 算 机 执行 得 就 越 快 。 
所 以 是 什么 限制 了 CPU 的 速度 呢 ? 周期 必须 足够 长 ， 以 允许 信号 通过 组 合 电路 并 出 现在 寄 
存 器 的 输入 《寄存 器 是 时 序 电 路 )， 然 后 下 一 个 时 钟 脉冲 才能 到 达 。 
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// Fetch the instruction specifier and increment PC by 1 


UnitPre: IR=0x000000, PC=0x00FF, Mem[0x00FF]=0xAB, S=0 
UnitPost: IR=0xAB0000, PC=0x0100 


// MAR <- PC. 
1. A=6, B=7; MARCk 
// Fetch instruction specifier. 
. MemRead 
. MemRead 
. MemRead, MDRMux=0; MDRCk 
IR <- instruction specifier. 
. AMux=0, ALU=0, CMux=1, C=8; LoadCk 


PC <- PC plus 1, low-order byte first. 
6. A=7, B=23, AMux=1, ALU=1, CMux=1, C=7; SCk, LoadCk 
. A=6, B=22, AMux=1, CSMux=1, ALU=2, CMux=1, C=6; LoadCk 





图 12-5 ”获取 指令 指示 符 和 PC 加 1 的 控制 信号 


<= T —> 
|< 一 周期 1 一 |< 一 周期 2 一 >|< 一 周期 3 一 >|< 一 周期 4 一 >|< 一 周期 5 一 >| 
LoadCk į : ; ; : m 





MARCk | 





MDRCk | 


MemRead : 





la A=6 en MemRead apla MemRead >j MemRead pla AMux=0 =] 


B=7 MDRMux=0 ALU=0 

MARCk MDRCk CMux=1 
C=8 

LoadCk 


图 12-6 图 12-5 的 前 五 个 周期 的 时 序 图 


例如 ， 在 图 12-6 中 周期 1 开始 的 时 候 ，A=6 把 5 条 A 线 设置 为 6 (dec)， 即 00110 (bin); 
B=7 把 5 条 B 线 设置 为 7 (dec)， 即 00111 (bin), Al 12-2 显示 ，A=6 H B=7 时 访问 PC 的 
高 字 节 和 低 字 节 。A 和 B 信号 通过 寄存 器 组 中 的 组 合 寻 址 电路 传播 ， 以 及 了 PC 的 内 容 放 到 
ABus 和 BBus 上 都 需要 时 间 。 周 期 7 要 足够 长 ， 以 便 在 图 12-6 所 示 周 期 1 结束 时 MARCk 
时 钟 脉冲 出 现 之 前 ， 这 些 信号 能 建立 起 来 并 出 现在 MARA 和 MARB 的 输入 端 。 周 期 1 结束 
时 的 时 钟 脉冲 出 现 后 ，PC 的 内 容 出 现在 MARA 和 MARB 中 。 

在 周期 2 开始 时 ， 来自 MARA 和 MARB 的 地 址 信号 开始 沿 系统 总 线 传播 到 内 存 子 系 
统 。 此 时 MemRead 信和 号 激活 由 地 址 译 码 电路 选择 的 内 存 子 系统 中 芯片 上 的 OE 线 。 内 存 子 
系统 中 的 传播 延迟 太 长 ， 以 至 于 在 主 系统 总 线 上 的 数据 可 用 之 前 通常 会 消耗 很 多 个 CPU 周 
期 。Pep/9 计算 机 模拟 了 这 一 事实 ， 它 要 求 在 地 址 送 入 MAR 之 后 ，MemRead 有 效 信号 要 持 
续 三 个 周期 ， 因 此 ， 该 信号 在 周期 2、3 和 4 被 置 为 高 电 平 。 

在 周期 4 结束 时 ， 由 于 同样 的 地 址 已 经 连续 三 个 周期 出 现在 内 存 地 址 寄存 器 ( MAR) 
中 ， 且 MemRead 也 在 这 三 个 周期 中 被 置 为 高 电 平 ， 因 此 ， 从 该 内 存 地 址 来 的 数据 就 会 出 现 
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在 系统 总 线 上 。 在 周期 4 中 ，MDRMux=0 将 MDR 复 用 器 线 设 为 0， 这 会 使 得 系统 总 线 上 的 
数据 经 过 复 用 器 传送 到 内 存 数据 寄存 器 ( MDR) 的 输入 端 。 周 期 4 的 MDRCk 脉冲 会 随时 钟 
把 指令 指示 符 送 入 MDR。 

周期 5 把 指令 指示 符 从 MDR 送 入 指令 寄存 器 仿 ， 过 程 如 下 所 述 。 首 先 ，AMux=0 将 
AMux 控制 线 设 置 为 0， 这 就 把 MDR 送 到 了 AMux 复 用 器 的 输出 。 接 下 来 ，ALU=0 将 
ALU 控制 线 设 置 为 0， 这 就 使 数据 不 改变 地 穿 过 ALU， 如 图 10-55 所 示 。CMux=1 把 数据 
从 ALU 送 到 CBus， 然 后 C=8 把 C 设置 为 8， 这 是 用 来 指定 指令 寄存 器 的 ， 如 图 12-2 所 
示 。 最 后 ，LoadCk 把 MDR 的 内 容 送 进 指令 寄存 器 。 

在 周期 5 中 ， 图 12-6 显示 了 该 周期 结束 时 的 LoadCk 脉冲 。 时 钟 周期 必须 足够 长 ， 
以 允许 在 LoadCk 脉冲 到 达 之 前 ，MDR 的 内 容 必 须 穿 过 复 用 器 和 ALU。 控 制 区 设计 者 必须 
计算 穿 过 这 些 组 合 电路 的 门 延 迟 数 量 ， 以 确定 在 时 钟 到 达 并 送 数据 进入 指令 寄存 器 之 前 最 少 
要 等 竺 多久。 周期 T 要 设置 得 足够 长 来 适应 这 些 门 延迟 。 

周期 6 一 7 把 PC 加 1。 在 周期 6，A=7 把 PC 的 低位 字 节 放 到 ABus; B=23 把 常数 1 放 
到 BBus; AMux=1 选择 让 ABus 通过 复 用 器 ; ALU=! 选择 算术 逻辑 单元 的 A 加 B 功 能 ， 这 
样 ALU 会 把 PC 的 低位 字 节 加 1 ; CMux=1 把 和 送 到 CBus， 而 C=7 把 和 送 回 PC 的 低位 字 
节 。 在 同一 周期 ，SCk 把 加 法 的 进位 送 到 影子 进位 S 位 。 在 SCk 把 ALU 的 Cout 存储 到 S, 
LoadCk 把 ALU 的 结果 存储 到 PC 的 低位 字 节 之 前 ， 周 期 要 足够 长 以 便 让 数据 流 过 周期 6 
中 其 他 控制 信号 指定 的 组 合 设备 。 

如 果 PC 的 低位 字 节 原来 为 1111 111 (bin)， 加 1 会 导致 向 高 位 字 节 的 进位 。 在 周期 7， 
A=6 把 PC 的 高 位 字 节 放 到 ABus; B=22 把 常数 0 HF] BBus; AMux=1 把 ABus 通过 复 用 器 
传递 到 ALU ; CSMux=1 把 保存 的 影子 进位 S$ 位 送 入 ALU 的 Cins ALU =2 选择 ALU A A 
加 B 加 Cin 功能， 把 从 低位 字 节 来 的 保存 的 进位 加 到 PC 的 高 位 字 节 上 ; CMux=1 把 结果 送 
到 CBus; C =6 使 得 CBus 上 的 数据 加 载 到 PC 的 高 位 字 节 上 ， 这 个 存储 是 借助 LoadCk 脉冲 
来 完成 的 。 

本 书 提供 的 Pep/9 CPU 软件 允许 你 编写 如 图 12-5 所 示 的 控制 序列 ， 并 模拟 它们 在 Pep/9 
数据 区 上 的 执行 。 软 件 对 由 UnitPre 和 UnitPost 语句 指定 序列 的 正确 性 提供 单元 测试 。 在 控 
制 序列 执行 前 ，UnitPre 语句 可 以 把 内 存 位 置 、 寄 存 器 组 位 置 ， 以 及 状态 位 设置 为 任意 值 。 
在 控制 序列 执行 后 ，UnitPost 语句 会 测试 内 存 位 置 、 寄 存 器 组 位 置 或 状态 位 的 值 。 

例如 ， 在 图 12-5 中 ，UnitPre 语句 把 R RENE, PC 设置 为 00FF (hex), Mem[00FF] 
设置 为 AB (hex)(CPWX this, s 的 指令 指示 符 )， 影 子 位 $ 设置 为 0。 在 这 些 初 始 条 件 下 ， 获 取 
指令 指示 符 并 将 程序 计数 器 加 1 会 把 AB (hex) 放 和 指令 寄存 器 ， 并 将 程序 计算 器 的 值 增加 到 
0100 (hex)。 由 于 UnitPost 语句 指定 了 这 些 数值 ， 软 件 在 控制 序列 模拟 结束 时 对 它们 进行 自动 
测试 ， 并 显示 消息 说 明 这 些 后 置 条 件 是 否 满足 。 

通过 组 合 周期 有 可 能 减少 图 12-5 中 的 周期 数 。 图 12-7 中 的 控制 序列 与 图 12-5 中 的 控 
制 序列 进行 了 相同 的 处 理 ， 但 是 只 有 5 个 周期 ， 而 不 是 7 个 周期 。 周 期 1 把 PC 副本 放 入 
MAR， 这 个 原始 的 副本 在 周期 2、3、4 都 会 留 在 MAR 中 。 因 此 ，PC 的 值 在 周期 2 和 3 都 
可 以 递增 ， 且 不 用 干扰 MAR 中 的 原始 值 。 图 12-7 中 的 控制 序列 把 图 12-5 中 的 周期 6 和 周 
期 2 组 合 在 了 一 起 。 在 周期 2， 图 12-5 中 没有 使 用 ABus、BBus 和 CBus， 因 此 在 这 个 周期 
中 ， 低 位 字 节 加 1 和 系统 等 待 内 存 读 可 以 同时 发 生 。 同 样 ， 周 期 7 与 周期 3 也 进行 了 组 合 。 
周期 数 从 7 减少 到 5 使 得 时 间 节 约 了 2/7=29%。 
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// Fetch the instruction specifier and increment PC by 1 


UnitPre: IR=0x000000, PC=0x00FF, Mem[0x00FF]=0xAB, S=0 
UnitPost: IR=0xAB0000, PC=0x0100 


// MAR <- PC. 
. A=6, B=7; MARCk 
Fetch instruction specifier, PC <- PC + 1. 
. MemRead, A=7, B=23, AMux=1, ALU=1, CMux=1, C=7; SCk, LoadCk 
: MemRead, A=6, B=22, AMux=1, CSMux=1, ALU=2, CMux=1, C=6; LoadCk 
. MemRead, MDRMux=0; MDRCk 
IR <- instruction specifier. 
. AMux=0, ALU=0, CMux=1, C=8; LoadCk 


图 12-7 组 合 图 12-5 的 周期 


不 能 任意 组 合 控制 序列 中 的 时 钟 周期 ， 必 须 记 住 图 12-5 所 示 的 控制 序列 中 的 每 一 个 带 
编号 的 行 都 表示 一 个 CPU 周期 。 有 些 周期 依赖 于 前 一 周期 的 结果 。 例 如 ， 不 能 把 图 12-5 中 
的 周期 4 和 周期 5 组 合 到 一 起 ， 因 为 周期 5 依赖 于 周期 4 的 结果 。 周 期 4 设置 MDR 的 内 
容 ， 而 周期 5 要 使 用 MDR 的 内 容 ， 所 以 周期 5 必须 在 周期 4 之 后 完成 。 

在 计算 机 组 成 中 硬件 并 发 是 一 个 很 重要 的 问题 。 设 计 者 总 是 保持 警觉 要 利用 硬件 并 发 来 
提高 性 能 。 当 然 ， 实 际 中 不 会 使 用 图 12-5 的 七 周期 序列 ， 因 为 图 12-7 所 示 的 组 合 周期 能 够 
不 增加 电路 就 提高 性 能 。 

虽然 这 里 没有 给 出 控制 区 的 细节 ， 但 是 也 可 以 想象 它 会 检测 刚刚 取出 的 指令 ， 看 它 是 否 
是 一 元 指令 。 控 制 区 会 把 B 设置 为 8， 把 指令 指示 符 放 到 BBus 上 进行 检测 。 如 果 取 出 的 指 
令 不 是 一 元 的 ， 那 么 控制 区 必须 再 获取 操作 数 指示 符 ， 相 应 地 增加 PC。 获取 操作 数 指示 符 
和 PC 加 1 的 控制 序列 是 章 末 的 一 道 练 习 。 

取 指 之 后 ， 控 制 区 会 检测 指令 指示 符 ， E 
决定 要 执行 哪 一 条 Pep/9 ISA3 指令 。 执 行 指 a 
令 的 控制 信号 不 仅仅 取决 于 操作 码 ， 还 取决 立即 数 OprndSpec 









于 寄存 器 rz 字 段 和 寻 址 aaa 字段 。 图 12-8 给 直接 Mem[OprndSpec] 

出 了 每 种 寻 址 方式 的 操作 数 和 操作 数 指示 符 间接 Mem[Mem[OprndSpec]] 

(OprndSpec) 之 间 的 关系 。 saat Fe eee 
ASS OR a erent aiths BAM 栈 相对 间接 Mem[Mem[SP + OprndSpec]] 

条 指令 ， 控 制 区 必须 提供 让 数据 区 计算 内 存 

地 址 的 控制 信号 。 例 如 ， 执 行使 用 变 址 寻 址 || MeniQpen See +20 

方式 的 指令 ， 控 制 区 必须 执行 16 位 加 法 ,用 栈 变 址 Mem[SP + OprndSpec + X] 


操作 数 指示 符 (寄存 器 9 和 10) 的 内 容 加 上 栈 间接 变 址  Mem[Mem[SP + OprndSpec] + X] 
X (寄存 器 2 和 3 )。 加 法 的 结果 之 后 会 加 载 
#| MAR, 为 LDWr 指令 的 内 存 读 或 STWr 48 
令 的 内 存 写 做 好 准备 。 

图 12-5 中 实现 汉 : 诺 依 曼 执行 周期 第 一 部 分 的 控制 序列 看 上 去 很 像 以 某 种 低级 编程 语 
言 编 写 的 程序 。 序 列 是 Mc2 层 的 微 代 码 语 言 。 控 制 区 设计 者 的 任务 是 设计 出 这 样 的 电路 ， 
对 数据 区 编程 以 实现 ISA3 JE (指令 集 架 构 层 ) 的 指令 。 


图 12-8 ”Pep/9 计算 机 的 寻 址 方式 
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接 下 来 的 几 个 例子 展示 了 执行 某 些 有 代表 性 的 ISA3 层 指令 所 需 的 Mc2 层 控制 序列 。 每 
个 例子 都 假设 指令 已 经 取出 ，PC 也 相应 地 增加 了 。 程 序 中 的 每 条 语句 都 占 一 行 ， 每 行 都 有 
编号 ， 每 条 语句 包括 一 些 组 合 信号 ， 让 数据 通过 复 用 器 或 选择 ALU 的 功能 ， 之 后 有 一 个 或 
几 个 时 钟 脉冲 来 加 载 一 些 寄存 器 。 记 住 ， 这 个 抽象 层次 (Me2 层 ) 上 的 程序 由 实现 更 高 抽象 
层次 (ISA3 层 ) 上 一 条 指令 所 需要 的 控制 信号 组 成 。 


12.1.3 ”存储 字 节 直接 寻 址 指令 
图 12-9 给 出 执行 下 面 这 条 指令 的 控制 序列 
STBA there,d 
这 里 there 是 一 个 符号 。STBr 指令 的 RTL 描述 是 
byte Oprnd + 1(8..15) 
这 条 指令 指明 了 采用 直接 寻 址 方式 ， 所 以 操作 数 是 Mem[OprndSpec]， 即 操作 数 指示 符 是 操 


作 数 在 内 存 中 的 地 址 。 该 指令 把 累加 器 的 最 低 有 效 字 节 存 储 到 该 地 址 对 应 的 内 存单 元 。 状 态 
位 不 受 影响 。 


// STBA there,d 
// RTL: byteOprnd <- A<8..15> 
// Direct addressing: Oprnd = Mem[OprndSpec] 


UnitPre: IR=O0xF1000F, A=0x00AB 
UnitPost: Mem[0x000F] =0xAB 


// MAR <- OprndSpec. 

1. A=9, B=10; MARCk 

// Initiate write, MBR <- A<low>. 

2. MemWrite, A=1, AMux=1, ALU=0, CMux=1, MDRMux=1; MDRCk 
3. MemWrite 

4. MemWrite 





图 12-9 实现 采用 直接 寻 址 存储 字 节 指令 的 控制 信号 


这 个 例子 和 后 面 的 其 他 例子 一 样 ， 假 设 操作 数 指示 符 已 经 在 指令 寄存 器 中 ， 也 就 是 假 
BOY: 诺 依 曼 周 期 的 取 指 、 译 码 和 PC 加 1 部 分 已 经 完成 。 程 序 只 给 出 了 冯 ， 诺 依 曼 周 期 的 
执行 部 分 。 单 元 测试 显示 如 果 累 加 器 的 最 低 有 效 字 节 是 AB (hex) 且 操 作 数 指示 符 为 000F 
(hex)， 那 么 语句 执行 后 ，Mem[000F] 就 必然 为 AB (hex). 

周期 1 把 操作 数 指示 符 送 到 内 存 地 址 寄存 器 。A=9 把 操作 数 指示 符 的 高 位 字 节 送 到 
ABus, B=10 把 操作 数 指示 符 的 低位 字 节 送 到 BBus， 而 MARCKk 使 得 ABus 和 BBus 随时 钟 
送 入 MAR 寄存 器 。 

周期 2 把 累加 器 的 低位 字 节 送 进 MDR。A=1 把 累加 器 的 低位 字 节 送 到 ABus，AMux=1 
使 数据 通过 AMux 进入 ALU, ALU=0 使 数据 不 经 改变 地 通过 ALU, CMux=1 使 数据 通过 
CBus, MDRMux=1 使 数据 经 过 MDRMux 到 达 MDR, MDRCk 把 数据 锁 存 进 MDR 中 。 这 
个 周期 也 会 启动 内 存 写 。 

周期 3 和 4 完成 内 存 写 ， 把 MDR 中 的 数据 存储 到 MAR 中 地 址 对 应 的 主 存 中 。 和 内 存 
读 一 样 ， 内 存 写 要 求 MemWrite 线 持 续 三 个 连续 的 周期 ， 给 内 存 子 系统 足够 的 时 间 从 总 线 获 
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取 数 据 地 址 。 被 传送 的 数据 只 需要 在 最 后 的 内 存 写 周 期 存在 于 MDR 中 。 TE ISA 层 ， 存 储 指 


令 不 影响 状态 位 ， 所 以 STBYTEA 的 控制 序列 中 没有 周期 会 给 NCk、ZCk、VCk 或 CCk 脉冲 。 


12.1.4 总 线 协议 


要 获取 指令 指示 符 就 需要 通过 系统 总 线 从 内 存 读 取 数据 ， 要 存储 一 个 字 节 就 需要 通过 系 
统 总 线 向 内 存 写 人 。 实 际 上 ， 计 算 机 系统 中 的 每 个 总 线 都 有 时 序 规 范 ， 系 统 中 的 其 他 组 件 必 
须 遵 守 这 个 规范 以 便 在 总 线 上 传输 信息 。 

Pep/9 系统 总 线 上 的 内 存 读 总 线 协议 需要 三 个 连续 的 周期 ，MemRead 在 每 个 周期 都 被 置 
为 有 效 。 读 操作 必须 遵循 以 下 规范 : 

。 第 一 个 MemRead 周期 之 前 ， 必 须 随时 钟 把 地 址 送 入 MAR. 

。 在 第 三 个 MemRead 周期 中 或 之 前 ， 必 须 随 时 钟 把 数据 从 系统 总 线 送 和 人 MDR。 

e 在 第 三 个 MemRead 周期 中 ， 不 能 预计 后 续 内 存 操作 把 新 值 随时 钟 送 入 MAR. 

你 可 能 试图 在 第 三 个 MemRead 周期 随时 钟 送 入 一 个 新 地 址 ， 推 测 该 地 址 在 第 三 个 周期 
结束 时 随时 钟 送 到 ， 那 么 它 在 前 两 个 周期 以 及 第 三 个 周期 的 大 部 分 时 间 里 都 应 该 在 系统 总 线 
上 。 但 是 ， 系 统 总 线 协议 不 会 允许 这 样 的 操作 。 

内 存 写 总 线 协 议 需要 三 个 连续 的 周期 ，MemWrite 在 每 个 周期 都 被 置 为 有 效 。 写 操作 必 
须 遵 循 以 下 规范 : 

e 第 一 个 MemWrite 周期 之 前 ， 必 须 随时 钟 把 地 址 送 入 MAR. 

e 在 第 一 个 或 第 二 个 MemWrite 周期 ， 必 须 随 时 钟 把 要 写 和 人 的 数据 送 入 MDR, 

e 在 第 三 个 MemWrite 周期 中 ， 可 以 预计 后 续 内 存 写 把 一 个 新 值 随时 钟 送 入 MDR。 但 

是 ， 不 能 预计 后 续 内 存 操 作 把 一 个 新 地 址 随时 钟 送 入 MAR. 

图 12-9 显示 ， 在 周期 2 中 要 写 和 内存 的 数据 值 随时 钟 被 送 入 MDR。 在 周期 3， 即 第 二 
个 MemWrite 周期 可 以 很 容易 地 随时 钟 送 和 MDR。 可 能 在 第 一 个 周期 把 数据 送 入 MDR， 然 
后 把 地 址 送 入 MAR， 再 然后 启动 内 存 写 。 但 是 这 需要 一 个 额外 的 周期 。 把 数据 随时 钟 送信 
MBR 和 一 个 MemWrite 周期 组 合 起 来 会 更 加 高 效 。 


12.1.5 ”存储 字 直接 寻 址 指令 
图 12-10 给 出 执行 下 面 这 条 指令 的 控制 序列 
STWA there,d 


这 里 there 是 一 个 符号 。STWr 指令 的 RTL 描述 是 
Oprnd & r 


STWA 45 STBA 之 间 的 区 别 是 : STWA 保存 的 是 两 个 字 节 ， 而 不 是 一 个 。 由 于 多 个 字 节 是 存 
放 在 连续 地 址 中 的 ， 操 作 数 指示 符 就 是 存放 第 一 个 字 节 的 地 址 ， 微 代码 将 这 个 地 址 加 1 就 得 
到 第 二 个 字 节 存储 的 地 址 。 

除了 两 点 不 同 之 外 ， 图 12-10 所 示 的 周期 1 一 周期 4 与 图 12-9 所 示 的 一 样 。 第 一 点 ， 
微 代码 存储 的 是 累加 器 的 高 位 字 节 (最 左边 )， 而 不 是 低位 字 节 。 第 二 点 ,与 周期 3 和 周期 4 
内 存 写 并 行 ， 它 把 操作 数 指 示 符 加 1 并 存储 到 临时 寄存 器 T2。 

周期 5 一 周期 8 把 累加 器 的 低位 字 节 保存 到 寄存 器 T2 中 计算 出 来 的 地 址 所 指向 的 内 存 
单元 。 周 期 5 把 T2 的 内 容 送 入 MAR， 周 期 6 把 累加 器 的 低位 字 节 送 入 MDR 并 启动 内 存 
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写 ， 周 期 7 和 周期 8 完成 内 存 写 。 两 个 单元 测试 检查 地 址 计算 中 可 能 的 进位 ， 第 一 测试 内 部 
进位 是 1， 第 二 个 测试 内 部 进位 是 0。 


// STWA there,d 
// RTL: Oprnd <- A 
// Direct addressing: Oprnd = Mem[OprndSpec] 


UnitPre: IR=0xE100FF, A=0xABCD, S=0 
UnitPost: Mem[0x00FF] =0xABCD 


// UnitPre: IR=OxE101FE, A=O0xABCD, S=1 
// UnitPost: Mem[0x01FE] =0xABCD 


// MAR <- OprndSpec. 
A=9, B=10; MARCk 
Initiate write, MDR <- A<high>. 
. MemWrite, A=0, AMux=1, ALU=0, CMux=1, MDRMux=1; MDRCk 
Continue write, T2 <- OprndSpec + 1. 
. MemWrite, A=10, B=23, AMux=1, ALU=1, CMux=1, C=13; SCk, LoadCk 
. MemWrite, A=9, B=22, AMux=1, CSMux=1, ALU=2, CMux=1, C=12; LoadCk 


MAR <- T2. 
. A=12, B=13; MARCk 
Initiate write, MDR <- A<low>. 
. MemWrite, A=1, AMux=1, ALU=0, CMux=1, MDRMux=1; MDRCk 
. MemWrite 
. MemWrite 





图 12-10 ”实现 采用 直接 寻 址 存储 字 指 令 的 控制 信号 


12.1.6 ”加 法 立即 数 寻 址 指令 
图 12-9 给 出 实现 下 面 这 条 指令 的 控制 序列 : 


ADDA this,i 


ADDr 的 RTL 表示 为 
rf+Opmd;N 二 r<0,Z r=0,V +e (Xh), Ce {进位 } 


这 条 指令 把 操作 数 加 到 寄存 器 +， 并 把 和 存放 在 寄存 右 r 中 ， 在 这 种 情况 下 就 是 累加 器 。 
因为 该 指令 采用 立即 数 寻 址 方式 ， 因 此 操作 数 就 是 操作 数 指示 符 。 和 前 面 一 样 ， 本 例假 设 已 
经 获取 了 指令 指示 符 ， 并 且 存 放 在 指令 寄存 器 中 了 。 

这 条 指令 会 影响 所 有 4 个 状态 位 。 虽 然 累加 器 能 存放 16 位 值 ， 不 过 Pep/9 CPU 的 数据 
区 只 能 处 理 8 位 数字 。 要 完成 加 法 ， 控 制 序列 必须 先 把 低位 字 节 相 加 ， 保 存 低位 相 加 产生 的 
影子 进位 ， 再 把 它 和 高 位 字 节 求 和 。 如 果 把 这 个 两 字 节 的 数字 当 作 有 符号 整数 ， 则 当 它 为 负 
时 ，N 会 被 设置 为 1; 否则 把 N 清 零 。 最 高 有 效 字 节 的 符号 位 决定 N 的 值 。 如 果 两 字 节 的 数 
FASO, 那么 Z 被 设置 为 1; AMZ BAS. MU, AN 位 不 同 ， 高 位 和 低位 字 节 的 值 共 
同 决定 Z 的 值 。 

周期 1 把 累加 器 的 低位 字 节 和 操作 数 指示 符 的 低位 字 节 相 加 。A=1 把 累加 器 的 低位 字 节 
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放 到 ABus, mi B=10 把 操作 数 指示 符 的 低位 字 节 放 到 BBus, AMux=1 把 ABus 送 到 复 用 器 ， 
ALU=1 选择 ALU 的 A 加 B 功能 ，CMux=1 把 和 送 到 CBus，C=1 把 ALU 的 输出 指向 累加 
器 的 低位 字 节 准备 存储 ，LoadCk 使 之 随时 钟 存 人 累加 占 。 在 同一 周期 ，AndZ=0 把 Zout 送 
到 AndZ 组 合 电 路 的 输出 ， 它 又 是 一 位 寄存 器 Z (一 个 D 触发 器 ) 的 输入 。ZCk 把 这 个 位 锁 
存 进 Z 位 ， 同 时 SCk 把 进位 锁 存 到 影子 进位 位 S。 
// ADDA this,i 


// RTL: A <- A + Oprnd; N <- A<0, Z <- A=0, V <- {overflow}, C <- {carry} 
// Immediate addressing: Oprnd = OprndSpec 


UnitPre: IR=0x700FFO, A=Ox0F11, N=1, Z=1, V=1, C=1, S=0 
UnitPost: A=0x1F01, N=0, Z=0, V=0, C=0 


// UnitPre: IR=0x707FFO, A=O0x0F11, N=0, Z=1, V=0, C=1, S=0 
// UnitPost: A=0x8F01, N=1, Z=0, V=1, C=0 


// UnitPre: IR=0x70FFO0, A=OxFFAB, N=0, Z=1, V=1, C=0, S=1 
// UnitPost: A=0xFEAB, N=1, Z=0, V=0, C=1 


// UnitPre: IR=0x70FFO0, A=0x0100, N=1, Z=0, V=1, C=0, S=1 
// UnitPost: A=0x0000, N=0, Z=1, V=0, C=1 


// A<low> <- A<low> + Oprnd<low>, Save shadow carry. 
1. A=1, B=10, AMux=1, ALU=1, AndZ=0, CMux=1, C=1; ZCk, SCk, LoadCk 


// Ashigh> <- A<high> plus Oprnd<high> plus saved carry. 
2. A=0, B=9, AMux=1, CSMux=1, ALU=2, AndZ=1, CMux=1, C=0; NCk, ZCk, VCk, CCk, LoadCk 


图 12-11 实现 使 用 立即 数 寻 址 方式 的 加 法 指令 的 控制 信号 





周期 2 把 累加 器 的 高 位 字 节 加 上 操作 数 指示 符 的 高 位 字 节 。A=0 把 累加 器 的 高 位 字 节 
放 到 ABus， 而 B=9 把 操作 数 指 示 符 的 高 位 字 节 送 到 BBus。CMux=1 把 影子 进位 位 S 送 
到 ALU 的 Cin，AMux=1 使 ABus 经 过 复 用 器 ，ALU=2 选择 ALU 的 A 加 B 加 Cin 功 能 ， 
CMux=1 把 和 送 到 CBus，C=0 把 它 指 向 累加 器 的 高 位 字 节 准备 存储 ，LoadCk 会 在 时 钟 到 来 
的 时 候 把 它 送 入 寄存 器 。AndZ=1 把 ZoutANDZ 的 结果 送 到 AndZ 组 合 电路 的 输出 ， 它 会 作 
为 Z 位 的 输入 。ZCk 把 这 个 位 锁 存 进 状态 位 。 当 且 仅 当 Zout 和 Z 都 为 1 时 ，Z 位 的 内 容 才 
会 锁 存 为 1。Z 的 值 会 随 着 周期 1 的 ZCk 被 保存 ， 当 且 仅 当 低位 相 加 的 和 为 全 0 的 时 候 ， 它 

708) 会 继续 保持 为 1。 所 以 ， 当 且 仅 当 和 的 16 位 都 为 0 时 ，Z 的 最 终 值 为 1。 其 他 3 个 状态 位 
(N, VAC) 反映 的 是 高 位 相 加 的 状态 ， 它 们 在 周期 2 随 着 NCk、VCk 和 CCk 存储 。 

图 12-11 给 出 了 这 个 ISA3 指令 实现 的 四 个 单元 测试 。 每 个 单元 测试 都 会 得 到 状态 位 
NZVC 的 不 同 最 终 值 集 合 ， 激 活 测试 的 方法 是 取消 测试 注释 。 由 于 ADDA 指令 会 影响 全 部 
四 个 状态 位 ， 因 此 它们 的 初始 值 被 设置 为 最 终 状 态 下 应 有 值 的 反 。 比 如 ， 在 第 二 个 单元 测试 
中 ， 状 态 位 的 最 终 值 应 该 是 NZVC=1010， 那么 ,该 单元 测试 的 初始 值 就 是 NZVC=0101。 


12.1.7 装 入 字 间 接 寻 址 指令 
图 12-12 给 出 执行 下 面 这 条 指令 的 控制 序列 : 


LDWX this,n 
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LDWr 的 RTL 表示 为 


r<Oprmd;Ner<0,Zer=0 


这 条 指令 从 内 存 将 两 个 字 节 装 人 变 址 寄存 器 。 因 为 使 用 的 是 间接 寻 址 方式 ， 所 以 如 图 12-8 
所 示 ， 操 作 数 是 Mem[Mem[OprndSpec]]， 操 作 数 指示 符 是 操作 数 的 地 址 的 地 址 。 控 制 序 列 
必须 从 内 存 中 取出 一 个 字 ， 把 它 作为 操作 数 的 地 址 ， 还 需要 再 取 一 次 才能 得 到 操作 数 。 


// LDWX this,n 
// RTL: X <- Oprnd; N <- X<0, Z <- X=0 
// Indirect addressing: Oprnd = Mem[Mem[OprndSpec] ] 


UnitPre: IR=0xCA0012, Mem[0x0012]=0x26D1, Mem[0x26D1] =0x53AC 
UnitPre: N=1, Z=1, V=0, C=1, S=1 
UnitPost: X=0x53AC, N=0, Z=0, V=0, C=1 


// UnitPre: IR=0xCA0012, X=0xEEEE, Mem[0x0012]=0x00FF, Mem[0x00FF] =0x0000 
// UnitPre: N=1, Z=0, V=1, C=0, Sel 
// UnitPost: X=0x0000, N=0, Z=1, V=1, C=0 


T3<high> <- Mem[OprndSpec], T2 <- OprndSpec + 1. 
. A=9, B=10; MARCk 
. MemRead, A=10, B=23, AMux=1, ALU=1, CMux=1, C=13; SCk, LoadCk 
. MemRead, A=9, B=22, AMux=1, CSMux=1, ALU=2, CMux=1, C=12; LoadCk 
. MemRead, MDRMux=0; MDRCk 
. A=12, B=13, AMux=0, ALU=0, CMux=1, C=14; MARCk, LoadCk 


T3<low> <- Mem[T2] . 
. MemRead 
. MemRead 
. MemRead, MDRMux=0; MDRCk 
- AMux=0, ALU=0, CMux=1, C=15; LoadCk 


Assert: T3 contains the address of the operand. 

X<high> <- Mem[T3], T4 <- T3 + 1. 

. A=14, B=15; MARCk 

。 MemRead, A=15, B=23, AMux=1, ALU=1, CMux=1, C=17; SCk, LoadCk 

. MemRead, A=14, B=22, AMux=1, CSMux=1, ALU=2, CMux=1, C=16; LoadCk 

. MemRead, MDRMux=0; MDRCk 

. A=16, B=17, AMux=0, ALU=0, AndZ=0, CMux=1, C=2; NCk, ZCk, MARCk, LoadCk 


X<low> <- Mem[T4] . 

. MemRead 

. MemRead 

. MemRead, MDRMux=0; MDRCk 

. AMux=0, ALU=0, AndZ=1, CMux=1, C=3; ZCk, LoadCk 





图 12-12 ”实现 使 用 间接 寻 址 方式 的 装 和 人 字 指令 的 控制 信号 


图 12-13 给 出 执行 图 12-12 的 控制 序列 的 效果 ， 假 设 符号 this 的 值 为 0012 (hex), AFF 
的 初始 值 如 地 址 0012 和 26D1 所 示 。Mem[0012] 的 值 为 26D1 (hex)， 这 是 操作 数 的 地 址 。 
Mem[26D1] 是 操作 数 ， 值 为 53AC ( hex)， 这 条 指令 就 是 要 把 它 装 人 变 址 寄存 器 。 该 图 显示 
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了 这 个 控制 序列 影响 的 每 个 寄存 器 的 地 址 。 指 令 寄 存 器 的 第 一 个 字 节 CA 是 采用 间接 寻 址 的 
LDWX 指令 的 指令 指示 符 。 


CPU 
8 





mA] 
9 10 
Opmdspec[ 00 | 12 ] 
12 13 
nfo] a | 
‘4 ay 2-3 
14 15 
nLa Ta 
| tE ames 
周期 1-5 
16 17 
ra 26 可] 
= a 周期 11-12 
2 3 
x ac ] 
| 人 周期 15-18 


周期 10-14 
图 12-13 图 12-12 所 示 控 制 序列 的 执行 结果 


周期 1 ~ 5 把 Mem[OprndSpec] 传送 到 临时 寄存 器 T3 的 高 位 字 节 。 在 周期 1，A=9 和 
B=10 把 操作 数 指示 符 分 别 放 到 ABus 和 BBus， 而 MARCk 用 时 钟 把 它们 送 进 内 存 地 址 寄存 
器 。 在 周期 2 发 起 一 个 内 存 读 ， 周 期 3 继续 该 操作 ， 周 期 4 会 完成 该 操作 。 周 期 5 按照 通常 
的 方式 把 数据 从 MDR 送 到 T3 的 高 位 字 节 。 
"9 在 内 存 读 周期 中 ， 周 期 2 ~ 3 在 上 述 操作 的 同时 ， 把 操作 数 指示 符 加 1， 并 把 结果 存储 
710| 在 临时 寄存 器 T3 中 。 周 期 2 把 操作 数 指示 符 的 低位 字 节 加 1， 周 期 3 会 把 低位 字 节 相 加 可 
能 产生 的 进位 考虑 进 高 位 字 节 加 法 中 。 周 期 $ 把 T2 中 计算 出 来 的 值 通过 ABus 和 BBus 送 
À MAR， 同时 也 通过 CBus 把 MDR 的 值 送 入 T3. 
周期 6 一 9 使 用 T2 中 计算 出 来 的 地 址 获取 操作 数 地 址 的 低位 字 节 。 周 期 6 发 起 内 存 读 ， 
周期 7 继续 内 存 读 ， 周 期 8 完成 读 并 把 这 个 字 节 从 内 存 锁 存 进 MDR 中 。 周 期 9 把 这 个 字 节 
从 MDR 经 过 AMux 送 进 T3 的 低位 字 节 。 
此 时 ， 可 以 断言 临时 寄存 器 T3 包含 操作 数 的 地 址 ， 本 例 中 值 为 26D1 (hex). Ra, A 
以 获取 操作 数 的 第 一 个 字 节 ， 把 它 装 入 变 址 寄存 器 的 第 一 个 字 节 。 周 期 10 ~ 14 执行 装 入 过 
程 。LDWr 的 RTL 描述 表明 这 条 指令 会 影响 N 和 Z 位 。N 位 是 由 最 高 有 效 字 节 的 符号 位 决 
定 的 。 所 以 ,周期 14 包括 时 钟 脉冲 NCk， 把 经 过 ALU 的 字 节 存 进 N 位 。Z 位 取决 于 两 个 
字 节 的 值 ， 所 以 周期 14 还 包括 AndZ=0 和 ZCk， 以 把 Zout 信 号 保存 到 ZZ 寄存 器 。 周 期 11 
和 周期 12 增加 T3， 并 在 内 存 读 的 同时 把 结果 保存 到 T4。 
周期 15 ~ 18 把 第 二 个 字 节 放 到 变 址 寄存 器 。 周 期 18 包括 AndZ=1， 这 样 来 自 低 位 字 


#12% t+tAMmMAK 473 


节 的 Z 值 (在 周期 14 存储 的 ) 会 和 来 自 高 位 字 节 的 Zout HEAT AND, ZCk 会 存储 该 指令 装 
入 的 16 位 数字 的 正确 的 Z 值 。 

第 一 个 单元 测试 把 这 些 值 初始 化 为 对 应 于 图 12-13 的 值 。 在 这 样 的 初始 值 下 ，Z 的 最 
终 值 为 0， 因 为 装 人 值 不 全 为 0。 第 二 个 单元 测试 把 两 个 全 零 字 节 装 人 变 址 寄存 器 ， 因 此 ， 
Z 的 最 终 值 就 是 1。 当 它 增 加 00FF (hex) 时 ， 第 二 个 单元 测试 还 要 用 影子 进位 位 测试 内 部 
进位 。 

12.1.8 算术 右 移 指令 

图 12-14 给 出 执行 这 条 一 元 指令 的 控制 序列 : 

ASRA 

ASRr 指令 的 RTL 表示 为 

C er15),T1.15)  1(0..14); Ner<0,Zer=0 

右 移 指令 不 可 能 溢出 ， 因 此 V 位 不 受 ASRr 的 影响 。ASRr 指令 是 一 元 的 ， 没 有 内 存 访 
间 ， 这 使 得 控制 序列 很 简短 。 


// ASRA 
// RTL: C <- A<15>, A<1..15> <- A<0..14>; N <- 


UnitPre: IR=0x0C0000, A=0xFF01, N=1, Z=1, V=1, 
UnitPost: A=0xFF80, N=1, Z=0, V=1, C=1 


// UnitPre: IR=0x0C0000, A=0x7E00, N=1, Z=1, V=0, C=0, S=1 
UnitPost: A=0x3F00, N=0, Z=0, V=0, C=0 


UnitPre: IR=0x0C0000, A=0x0001, N=1, Z=1, V=0, C=0, S=1 
UnitPost: A=0x0000, N=0, Z=1, V=0, C=1 


Arithmetic shift right of high-order byte. 

. A=0, AMux=1, ALU=13, AndZ=0, CMux=1, C=0; NCk, ZCk, SCk, LoadCk 
Rotate right of low-order byte. 

. A=1, AMux=1, CSMux=1, ALU=14, AndZ=1, CMux=1, C=1; ZCk, CCk, LoadCk 





图 12-14 实现 一 元 ASRA 指令 的 控制 信号 


因为 ALU 只 能 计算 8 位 数字 ， 所 以 必须 要 把 16 位 位 移 分 解 成 两 个 8 位 运算 。 图 10-62 
给 出 ALU 执行 的 四 个 移 位 和 循环 操作 。 要 做 算术 右 移 ， 控 制 序列 对 高 位 字 节 做 算术 右 移 ， 
再 对 低位 字 节 做 循环 右 移 。 

周期 1 中 ，A=0 把 累加 器 的 高 位 字 节 放 到 ABus，AMux=1 把 它 送 到 ALU，ALU=13 
选择 算术 右 移 运算 ，CMux=1 和 C=0 把 结果 送 到 累加 器 准备 存储 ， 而 LoadCk 会 存储 它 。 
AndZ=0 把 位 移 运算 的 Zout 送 到 工 寄存 器 ， 而 ZCk 会 存储 它 。NCk 会 存储 来 自 高 位 运算 的 
N 位， 这 是 最 终 的 值 。SCk 会 存储 来 自 高 位 运算 的 影子 进位 $ 位 ,但 这 不 是 C 的 最 终 值 。 

周期 2 中 ，A=1 把 累加 髓 的 低位 字 节 放 到 ABus，AMux=1 把 它 送 到 ALU, CSMux=1 
选择 影子 进位 位 作为 ALU 的 Cin 输入 ，ALU=14 选择 循环 右 移 运算 ，CMux=1 和 C=1 把 
结果 送 到 累加 器 准备 存储 ， 而 LoadCk 会 存储 这 个 结果 。AndZ 会 使 得 AndZ 组 合 电 路 执行 
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Zout 和 Z 的 AND 运算 ,ZCk 会 把 这 个 结果 存储 到 Z 中 作为 最 终 值 。CCk 会 存储 Cout 作为 
C 的 最 终 值 。 

图 12-14 给 出 了 ASRA 实现 的 三 个 单元 测试 。 第 一 个 测试 当 符号 位 和 影子 进位 位 为 1 时 
复制 这 两 个 状态 位 。 第 二 个 测试 当 符号 位 和 影子 进位 位 为 0 时 复制 这 两 个 状态 位 。 第 三 个 测 
试 最 终结 果 为 全 0 H Z 位 最 终 值 为 1 时 该 实现 的 情况 。 在 所 有 的 三 个 单元 测试 中 ，V 位 的 值 
不 变 。 


12.1.9 CPU 控制 区 


图 12-1 中 的 CPU 划分 为 数据 区 和 控制 区 。 给 定 一 个 实现 一 条 ISA3 指令 所 需 的 控制 信 
号 序列 ， 例 如 图 12-9 中 实现 STBA 指令 的 序列 ， 问 题 是 该 如 何 设 计 控 制 区 来 产生 这 样 的 信 
号 序列 呢 ? 

微 代码 背后 的 理念 是 控制 信号 的 序列 实际 上 是 一 个 程序 。 图 12-4 描述 的 是 汉 “' 诺 依 曼 
周期 看 上 去 都 很 像 一 个 C 程序 。 设 计 控 制 区 的 一 种 方式 是 创建 低层 次 的 冯 ，… 诺 依 曼 机 器 ， 
就 像 Mc2， 即 微 代 码 抽 象 屋 ,位 于 ISA3 和 LG1 之 间 。 像 所 有 抽象 层 一 样 ， 这 一 层 有 自己 的 
语言 ， 包 括 一 组 微 编程 语句 。 控 制 区 是 一 个 单独 的 微机 器 ， 有 自己 的 微 内 存 uMem 和 自己 
的 微 程 序 计数 器 uPC， 以 及 自己 的 微 指令 寄存 器 uIR。 和 ISA3 层 机 器 不 同 ，Mc2 层 的 机 器 
只 有 一 个 烧 和 信 uMem ROM 当中 的 程序 。 一 旦 芯片 制造 完成 ， 微 程序 就 不 可 以 改变 了 。 这 个 

13) 程序 包含 一 个 循环 ， 唯 一 的 目的 是 实现 ISA3 的 汉 “ 诺 依 曼 周期 。 

714 图 12-15 给 出 Mc2 层 用 微 代 码 实现 的 Pep/9 的 控制 区 ， 图 12-2 的 数据 区 有 34 条 来 自 
右边 的 控制 线 ， 用 以 控制 数据 流 ， 它 们 对 应 于 图 12-15 中 指向 左边 的 34 条 控制 线 。 图 12-2 
中 从 数据 区 到 控制 区 总 共有 12 条 数据 线 ，8 条 来 自 BBus, 4 条 来 自 状态 位 ， 它 们 对 应 于 
12-15 来 自 左 边 的 12 条 数据 线 。 

微 程 序 计数 器 包含 下 一 条 要 执行 的 微 指 令 的 地 址 。uPC 是 上 位 宽 ， 所 以 可 以 指向 uMem 
中 2 条 指令 中 的 任意 一 条 。 微 指令 是 位 宽 的 ， 所 以 uMem 中 每 个 单元 的 宽度 和 ulR 的 宽 
度 也 都 为 a。 在 Mc2 层 ， 没 有 理由 要 求 微 指令 的 宽度 必须 是 2 FE. n 可 以 是 你 想 要 的 任意 
奇怪 的 值 。 能 这 么 灵活 是 因为 uMem 只 包含 指令 不 包含 数据 ,指令 和 数据 没有 混合 到 一 起 ， 
所 以 没 必要 要 求 内 存单 元 的 大 小 必须 适合 两 者 。 

图 12-16 给 出 了 微 指 令 的 指令 格式 。 最 右边 的 34 位 是 控制 信号 ， 要 发 送 到 数据 区 ; Fl 
下 的 字段 分 为 两 部 分 : Branch (分 支 ) 字段 和 Addr (地 址 ) 字段 。ISA3 层 的 程序 计数 器 每 次 
加 1， 因为 正常 的 控制 流 把 指令 顺序 存储 在 主 存 中 并 且 顺 序 执行 ， 所 以 唯一 的 变化 是 由 于 分 
支 指 令 导 致 的 PC 变化 。 但 是 在 Mc2 层 ，uPC 的 变化 不 是 加 1， 而 是 每 条 微 指 令 包 含 计算 下 
一 条 微 指令 地 址 的 信息 。Branch 字段 指明 如 何 计算 下 一 条 微 指令 的 地 址 ，Addr 字段 包含 用 
于 计算 的 数据 。 

例如 ， 如 果 下 一 条 微 指 令 不 依赖 于 来 自 数据 区 的 12 条 信和 号， 那么 Branch 字段 会 表明 这 
是 一 个 无 条 件 分 支 ，Addr 将 是 下 一 条 微 指令 的 地 址 。 实 际 上 ， 每 条 指令 都 是 一 条 分 支 指令 。 
要 按照 顺序 执行 一 组 微 指令 ， 必 须 让 每 条 微 指令 无 条 件 分 支 转移 到 下 一 条 微 指 令 。 图 12-15 
的 译 码 器 / 分 支 ( decoder/branch) 单元 的 作用 是 ， 当 Branch 字段 表明 是 一 个 无 条 件 分 支 时 ， 

就 让 Addr 直接 通过 进入 uPC， 无 论 来 自 数据 区 的 12 条 线 的 值 是 什么 。 

举 个 例子 来 说 明 条 件 微 分 支 指 令 的 必要 性 一 一 BRLT 的 实现 。BRLT 的 RTL 描述 是 
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12-16” 微 指令 的 指令 格式 








如 果 N 位 是 1， 则 PC 获得 操作 数 。 要 实现 BRLT， 微 指令 必须 检查 NN 位 的 值 ， 要 么 
什么 都 不 做 ， 要么 分 支 跳 转 到 另 一 组 微 指令 序列 ， 用 操作 数 蔡 代 PC。 这 条 微 指 令 包 含 的 
Branch 字段 会 指明 下 一 个 地 址 是 用 N 和 Addr 一 起 计算 得 出 的 。 如 果 N 为 0， 计算 会 产生 一 
个 地 址 ; 如 果 N 为 1, 会 产生 男 一 个 地 址 。 

通常 来 说 ， 条 件 微分 支 需要 根据 Addr 和 判断 条 件 依赖 的 、 来 自 数据 区 的 信号 计算 出 下 
一 条 微 指令 的 地 址 。 最 大 的 条 件 分 支 是 决定 要 执行 哪 条 ISA3 指令 的 分 支 ， 换 句 话 说， 就 是 
冯 “' 诺 依 曼 周 期 的 译 码 部 分 。 对 ISA 指令 译 码 的 微 指令 的 B 字段 为 8， 这 会 把 IR 的 第 一 个 
字 节 放 到 BBus。( IR 的 寄存 器 地 址 参见 图 12-2.) Branch 字段 会 说 明 是 指令 译 码 ， 译 码 器 / 
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分 支 单元 会 输出 实现 该 指令 的 微 指令 序列 中 第 一 条 微 指 令 的 地 址 。 

微 指令 中 Branch 和 Addr 字段 的 细节 ， 以 及 译 码 器 /分 支 单 元 的 实现 不 在 本 书 讨论 范围 
ŻA. BAR 12-15 和 图 12-16 省 略 了 微 代 码 层 设计 中 很 多 实际 问题 ,但 还 是 能 说 明 Me 层 
的 基本 设计 元 素 。 


12.2 ”性 能 


从 理论 的 角度 ， 所 有 真实 的 冯 ， 诺 依 曼 计 算 机 器 的 计算 能 力 都 是 相同 的 。 给 定 一 种 机 制 
将 有 限 容量 的 磁盘 存储 与 一 台 机 器 相连 接 ， 这 在 计算 能 力 上 等 价 于 图 灵机 。 在 计算 能 力 方 
面 ，Pep/9 和 世界 上 最 大 的 超级 计算 机 之 间 唯 一 的 差别 是 计算 占用 的 时 间 。 为 了 计算 出 一 个 
问题 的 解答 ，Pep/9 可 能 需要 100 万 年 ， 超 级 计算 机 可 能 只 需要 1 毫秒 ,但 是 理论 上 它们 可 
以 做 同样 的 事情 。 

从 实际 的 角度 ,时间 很 重要 。 在 所 有 其 他 条 件 相同 的 情况 下 ， 越 快 越 好 。 虽 然 LG1 层 
图 12-2 的 数据 区 可 以 实现 ISA3 层 的 Pep/9， 问 题 是 ， 速 度 有 多 快 ? 提高 性 能 的 根本 来 源 是 
空间 /时 间 折 中 。 硬 件 工程 师 可 以 通过 增加 芯片 上 的 电路 来 减少 计算 时 间 ， 这 就 是 增加 空 
间 。 所 有 的 计算 中 时 间 都 包含 了 两 个 方面 : 一 个 是 执行 计算 的 时 间 ， 一 个 是 在 计算 机 系统 组 
件 之 间 传 递 信息 的 时 间 。 

计算 机 系统 提高 性 能 的 三 种 常用 技术 是 : 

o 增加 数据 总 线 的 宽度 

e 在 CPU 和 内 存 子 系统 中 插入 高 速 缓存 (cache ) 

o 用 流水 线 增加 硬件 并 行 性 

前 两 个 技术 减少 了 主 存 与 CPU 之 间 传 递 信息 的 时 间 。 第 三 个 技术 减少 了 计算 的 执行 时 
间 。 这 三 个 技术 都 是 通过 在 系统 中 增加 空间 来 减少 执行 时 间 。 本 节 介 绍 如 何 通 过 增加 数据 总 
线 宽度 以 及 使 用 高 速 缓存 来 提高 性 能 ， 下 一 节 将 介绍 MIPS 机 器 的 流水 线 设计 。 


12.2.1 数据 总 线 宽度 和 内 存 对 齐 


减少 主 存 与 CPU 之 间 传 递 信息 所 需 时 间 最 直接 方法 是 增加 总 线 的 宽度 。 如 果 把 数据 
总 线 宽度 从 8 条 增加 到 16 条 , 那么 每 次 内 存 读 就 可 以 从 内 存 获 取 两 个 字 节 ， 而 不 是 一 个 。 
图 12-12 展示 了 间接 寻 址 装 人 指令 的 实现 。 周 期 2 ~ 4 取得 低位 字 节 ， 周 期 6 一 8 取得 高 位 
字 节 。 如 果 数 据 总 线 有 16 条 线 ， 那 么 这 两 个 字 节 就 可 以 在 一 个 包含 三 个 而 非 六 个 周期 的 内 
存 访问 中 被 读 出 。 

图 12-12 展示 的 系统 总 线 中 16 条 是 地 址 线 ，8 条 是 数据 线 。 为 了 适应 地 址 总 线 的 16 位 
宽度 ， 内 存 地 址 寄存 器 包含 了 两 个 部 分 : MARA 和 MARB。 如 果 数 据 总 线 不 是 8 条 ， 而 是 
16 条 ,那么 内 存 数据 寄存 器 也 必须 有 两 个 部 分 。 图 12-17 展示 了 Pep/9 CPU 的 设计 ， 其 数 
据 总 线 有 16 条 。 寄 存 器 组 与 图 12-2 一 样 ， 图 12-17 没有 显示 ; 左边 的 内 存 子 系统 也 没有 显 
示 。 内 存 数据 寄存 器 的 两 个 部 分 是 MDREven 和 MDROdd。 增 加 的 空间 来 自 于 数据 总 线 上 
额外 的 线 以 及 额外 的 内 存 数 据 寄 存 器 电路 。 这 种 空间 的 增加 可 能 会 减少 计算 时 间 。 

如 果 系 统 被 设计 成 按 两 字 节 大 小 来 访问 内 存 ， 主 存 就 可 以 设计 为 按 字 寻 址 ， 而 不 是 按 字 
节 寻 址 。 早 期 ,制造 商 设计 了 不 同 单元 大 小 的 内 存 子 系统 ， 其 中 的 一 些 就 是 一 个 地 址 对 应 两 
个 字 节 (一 个 字 )， 而 不 是 一 个 地 址 对 应 一 个 字 节 。 不 过 到 了 现在 ， 几 乎 所 有 的 计算 机 内 存 
都 是 按 字 节 寻 址 的 。 
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MARMux 


MARCk 





MDROCk 










SŽ 
一 一 一 一 一- CMux 
la — 4 alu 
C 


in 
| CSMux |<— CSMux 
Cout 
<— SCk 
ICl<— CCk 








加 < 一 NCk 


MemWrite 
MemRead 








图 12-17 两 字 节 数据 总 线 的 Pep/9 CPU 的 数据 区 


图 12-18 给 出 了 内 存 子 系统 响应 样 例 CPU 
请 求 向 CPU 传送 数据 的 地 址 。 如 果 CPU 把 
0AB6 放 入 MAR， 内 存 就 会 把 Mem[0AB6] 的 | MDREven MDROdd ~ 
内 容 送 入 MDREven， 把 Mem[0AB7] 的 内 容 0AB6 0AB6 0AB7 
送 入 MDROdd。 也 就 是 说 ， 它 传递 的 是 被 请 求 0AB7 UABE 0ABT 
地 址 对 应 的 字 节 和 该 地 址 后 一 个 地 址 对 应 的 字 
节 。 但 是 ， 如 果 CPU 把 0AB7 放 和 人 MAR, A 
存 还 是 会 把 同样 的 两 个 字 节 送 入 相同 的 数据 寄 se si ba 
存 器 。 这 就 表示 ， 它 传送 的 是 被 请 求 地 址 对 应 ”图 12-18 用 双 字 节 数 据 总 线 从 内 存 子 系统 向 
的 字 节 和 该 地 址 前 一 个 地 址 对 应 的 字 节 。 无 论 CPU 传送 的 数据 的 地 址 


0AB8 0AB8 0AB9 





478 BED ARE (F22) 


CPU 内 存 请 求 地 址 是 偶数 还 是 奇数 ， 偶 地 址 的 数据 会 被 送 入 MDREven， 奇 地 址 的 数据 会 被 
i& A MDROdd. 

图 12-19 展示 了 有 8 条 数据 总 线 的 图 12-2 和 有 16 条 数据 总 线 的 图 12-17 Aras AA 
存 引 脚 。 两 个 引 脚 图 一 个 明显 的 不 同 是 : 双 字 节 总 线 用 的 是 16 条 数据 线 ， 而 单字 节 总 线 用 
的 是 8 条 数据 线 。 另 一 个 不 同 是 图 12-17b 所 示 的 双 字 节 总 线 中 没有 低位 地 址 线 A0。 为 什 
么 没有 ， 因 为 它 从 没有 被 使 用 过 。 图 12-18 显示 ， 来自 0AB6 的 内 存 请 求 和 来 自 0AB7 的 
内 存 请 求 产 生 了 相同 的 访问 ， 即 Mem[0AB6] 送 入 MDREven, Mem[0AB7] 送 入 MDROdd. 
0AB6 (hex) 的 二 进 制 表 示 为 0000 1010 1011 0110 (bin)，0AB7 (hex) 的 二 进 制 表示 为 
0000 1010 1011 0111 (bin)， 所 以 最 后 一 位 A0 与 内 存 访 问 无 关 。 实 际 上 ， 地 址 线 A0 在 总 线 
上 是 不 需要 的 ， 因 此 即使 逻辑 上 是 16 条 地 址 线 ， 物 理 上 却 是 15 条 地 址 线 。 


A0 —> <=> DO <> DO 
Al 一 一 > <> DI Al —> <> D] 
A2 一 一 一 <> D2 A2 —> «—> D2 
A3 —> <> D3 A3 —> <—» D3 
A4 一 <» D4 A4 —> <> D4 
AS —= <=> D5 AS —= <> D5 
A6 一 一 > <—»> D6 A6 — <> D6 
A7 —> =<» D7 A7 —> =< > D7 
A8 —~ A8 —> <=> D8 
A9 -—> A9 一 一 一 <> D9 
A10 —> A10 —> <—> DIO 
All —> All —> <> DI! 
A12 一 一 人 12 一 一 一 <> D12 
A13 — A13 —> <=> D13 
Al4 — Al4 一 一 一 =< D14 
AIS SS AIS = <> DI5 
MemRead MemWrite MemRead MemWrite 
a) 8 条 数据 总 线 的 图 12-2 所 示 芯 b) 16 条 数据 总 线 的 图 12-17 所 示 芯 片 


图 12-19 两 个 Pep/9 主 存 芯片 的 引 脚 图 


图 12-2 的 单字 节 数 据 总 线 显 示 MDR 输出 连接 到 AMux 输入 ， 这 样 就 可 以 让 它 加 入 到 
ABus-CBus 数据 循环 中 。 但 是 对 图 12-17 的 双 字 节 数 据 总 线 来 说 ， 这 里 有 两 个 内 存 数 据 寄存 
器 。EOMux 即 奇 偶 复 用 器 ， 在 这 两 个 内 存 数据 寄存 器 中 选择 一 个 并 送 入 AMux 输入 端 ， 由 
此 进入 ABus-CBus 数据 循环 。 它 就 像 其 他 复 用 器 一 样 工作 ， 当 EOMux 控制 值 为 0 时 ， 把 
MDREven 输出 送 入 AMux 输入 ; “4 EOMux 控制 值 为 1 时 ， 把 MDROdd 输出 送 入 AMux 
输入 。 

图 12-17 所 示 Pep/9 CPU 设计 的 另 一 个 性 能 特点 是 从 MDR 寄存 器 到 MAR 寄存 器 的 另 
一 条 双 字 节 数 据 路 径 。 当 一 个 内 存 地 址 从 内 存 中 读 出 ， 随 后 又 要 被 送 入 MAR 时 ， 这 条 路 径 
能 缓解 这 种 情况 下 的 瓶颈 。 不 同 于 每 次 一 个 字 节 从 MDR 寄存 器 传送 地 址 ， 再 通过 寄存 器 组 
送 达 MAR， 这 条 双 字 节 数 据 路 径 允 许 只 在 一 个 周期 内 就 把 MDR 的 两 个 字 节 传送 到 MAR 寄 
存 器 。 标 记 为 MARMux 的 方 框 是 一 个 16 位 复 用 器 ， 它 受 MARMux 信号 控制 。 控 制 信号 规 
则 如 下 ， 
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e MARMux 控制 线 为 0 时 ,把 MDREven 送 入 MARA, 4 MDROdd 3 A MARB., 

e MARMux 控制 线 为 1 时, 把 ABus A MARA, 把 BBus 送 入 MARB。 

虽然 把 数据 总 线 宽 度 从 一 个 字 节 增加 到 两 个 字 节 会 提高 性 能 ， 但 是 这 却 会 使 得 汉 “' 诺 依 
曼 周 期 复杂 化 。 对 一 个 字 节 的 数据 总 线 来 说 ， 首 先 获 取 指 令 指 示 符 ， 它 是 一 个 字 节 的 。 如 果 
是 非 一 元 指令 ， 接 下 来 就 获取 操作 数 指示 符 ， 它 是 两 个 字 节 的 。 假 设 开 始 冯 : 诺 依 曼 周 期 时 
程序 被 装 入 到 地 址 0000。 执 行内 存 读 之 后 ， 指 令 指 示 符 被 送 入 MDREven， 之 后 的 一 个 字 节 
被 送 入 MDROdd。 如 果 第 一 条 指令 是 一 元 的 ， 那么 MDROdd 中 的 字 节 就 是 下 一 条 指令 的 指 
令 指 示 符 。 如 果 第 一 条 指令 是 非 一 元 的 ， 那么 MDROdd 中 的 字 节 就 是 操作 数 指示 符 的 第 一 
个 字 节 。 不论 是 哪 种 情况 ， 高 效 的 做 法 是 把 第 二 个 字 节 存 人 寄存 器 组 中 的 临时 寄存 器 Tl 以 
备 后 用 ， 而 不 需要 再 次 从 内 存 读 出 。 

图 12-20 给 出 了 获取 指令 指示 符 并 将 PC 加 1 的 控制 序列 。 它 与 图 12-5 的 微 代码 序列 相 
似 ， 只 不 过 那个 序列 只 需要 5 个 周期 。 图 12-20 多 出 来 的 是 周期 6， 它 预期 下 一 次 获取 ， 把 
随后 的 一 个 字 节 存 人 寄存 器 T1。 


// Fetch the instruction specifier and increment PC by 1 
// Assume: PC is even and pre-fetch the next byte 


UnitPre: IR=0x000000, PC=0x00FE, Mem[Ox00FE]=OxABCD, S=1 
UnitPost: IR=0xAB0000, PC=Ox00FF, T1=0xCD 


// MAR <- PC. 
1. A=6, B=7, MARMux=1; MARCk 
// Initiate fetch, PC <- PC + 1. 
: MemRead, A=7, B=23, AMux=1, ALU=1, CMux=1, C=7; SCk, LoadCk 
- MemRead, A=6, B=22, AMux=1, CSMux=1, ALU=2, CMux=1, C=6; LoadCk 
. MemRead, MDREMux=0, MDROMux=0; MDRECk, MDROCk 
IR <- MDREven, T1 <- MDROdd. 
. EOMux=0, AMux=0, ALU=0, CMux=1, C=8; LoadCk 
. EOMux=1, AMux=0, ALU=0, CMux=1, C=11; LoadCk 





图 12-20 用 双 字 节 数 据 总 线 的 汉 “， 诺 依 曼 周 期 的 取 指 和 增加 部 分 


只 有 知道 前 面 的 内 存 访问 已 经 把 指令 指示 符 预 取 到 寄存 器 Tl 时 ， 取 指令 指示 符 才 能 节 
省 时 间 。 图 12-21 给 出 了 这 个 场景 下 的 控制 序列 。 整 个 序列 只 有 3 个 周期 ， 完 全 不 需要 内 
存 读 。 控 制 区 很 容易 就 能 在 周期 开始 的 时 候 确定 指令 指示 符 是 否 已 经 预 取 。 如 果 程 序 计数 
器 是 偶数 ， 那 么 没有 预 取 ， 就 需要 使 用 图 12-20 所 示 序 列 ; 如 果 PC 是 奇数 ， 那 么 就 使 用 
图 12-21 所 示 序 列 。 

获取 操作 数 指示 符 也 有 类 似 的 考虑 。 如 果 程 序 计 数 器 是 偶数 ， 则 没有 字 节 被 预 取 。 控 制 
区 只 需 一 次 内 存 访问 就 可 以 获取 操作 数 指示 符 的 两 个 字 节 。 如 果 程 序 计 数 器 是 奇数 ， 那 么 操 
作 数 指示 符 的 第 一 个 字 节 已 经 被 预 取 ， 同 样 只 需要 一 次 内 存 访问 来 取得 操作 数 指示 符 的 第 二 
个 字 节 并 预 取 下 一 个 指令 指示 符 。 另 一 个 性 能 的 提升 是 一 次 把 PC 加 2， 而 不 是 做 两 次 加 1， 
后 者 对 于 单字 节 数 据 总 线 来 说 是 必需 的 (如 图 12-4 所 示 )。 在 这 些 场景 下 实现 获取 指令 指示 
符 的 控制 序列 是 本 章 结尾 留 给 学 生 的 一 道 习 题 。 
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// Fetch the instruction specifier and increment PC by 1 


// Assume instruction specifier has been pre-fetched 


UnitPre: IR=0x000000, PC=0x01FF, T1=0x12, S=0 
UnitPost: IR=0x120000, PC=0x0200 


// Fetch instruction specifier. 
1. A=11, AMux=1, ALU=0, CMux=1, C=8; CCk 


// PC <- PC plus 1. 
2. A=7, B=23, AMux=1, ALU=1, CMux=1, C=7; SCk, LoadCk 
3. A=6, B=22, AMux=1, CSMux=1, ALU=2, CMux=1, C=6; LoadCk 


图 12-21 ” 预 取 指令 指示 符 后 汉 ' 诺 依 曼 周 期 的 取 指 和 增加 部 分 





12.2.2 ”内 存 对 齐 


使 用 寄存 器 Tl 存储 预 取 的 字 节 提高 了 汉 : 诺 依 曼 周期 中 取 指 部 分 的 性 能 。 而 最 大 化 
1» 诺 依 曼 周期 中 执行 部 分 的 性 能 则 需要 数据 和 程序 语句 的 内 存 对 齐 。 比 如 ， 图 12-22a 显 
示 了 图 5-27 所 示 程 序 的 代码 片段 。 全 局 变量 examl 存储 在 固定 地 址 0003 处 ， 考 虑 执行 
LDWA 指令 ， 该 指令 把 存储 在 0003 的 数值 装 入 累加 器 。 由 于 0003 是 奇数 ,那么 CPU 从 地 
址 发 出 的 内 存 请 求 就 要 把 Mem[0002] 送 入 MDREven， 把 Mem[0003] 送 入 MDROdd。 即 使 
这 次 访问 会 从 内 存 装 人 两 个 字 节 ， 但 它 只 能 把 exam! 的 第 一 个 字 节 装 人 内 存 数据 寄存 器 。 
CPU 只 能 使 用 MDROdd 中 的 数值 ， 因 而 需要 进行 第 二 次 内 存 访问 以 获取 Mem[0004] 中 的 数 
值 。 由 于 仍然 需要 两 次 内 存 访问 ， 所 以 双 字 节 数 据 总 线 的 优势 没有 发 挥 出 来 。 


12000A 
120009 BR main bonus: 

bonus: .EQUATE 10 
0000 examl: «BLOCK 2 
0000 exam2: :BLOCK 2 


0000 score: -BLOCK 2 


00 

0000 examl: 
0000 exam2: 
0000 score: 


310004 main: 
310006 
C10004 
610006 


310003 main: DECI examl,d 
310005 DECI exam2,d 
C10003 examl,d 
610005 exam2,d 


a) 无 数据 对 齐 b) 有 数据 对 齐 
图 12-22 图 5-26 所 示 程 序 的 数据 对 齐 





如 果 exam] 的 第 一 个 字 节 是 存储 在 偶 地 址 的 ， 那么 只 需 一 次 内 存 访问 就 可 以 取得 
它 的 两 个 字 节 。 图 12-22b 显示 了 相同 的 程序 ， 但 在 examl 的 声明 之 前 插入 了 一 条 额外 
的 ALIGN 点 命令 。.ALIGN 点 命令 的 作用 是 在 必要 的 时 候 插 入 一 个 零 字 节 以 便 让 下 一 行 
生成 代码 开始 于 偶 地 址 。 图 12-22b 中 对 齐 点 命令 产生 的 这 个 额外 字 节 使 得 exam | 存储 到 
0004， 而 不 是 0003。 对 这 段 程序 ，LDWA 指令 让 CPU 请 求 一 个 从 0004 开始 的 内 存 访问 ， 
这 就 使 得 Mem[0004] 3% A MDREven, Mem[0005] 送 入 MDROdd， 仅 需 一 次 内 存 访问 就 可 
以 装 入 这 个 整数 的 值 。 
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汇编 语言 的 对 齐 命令 采用 的 整数 参数 是 2 的 寡 。 图 12-22b 中 ， 对 齐 命令 是 
-ALIGN 2 


参数 2 在 代码 中 插入 足够 多 的 零 字 节 来 使 得 下 一 行 代码 开始 于 偶 地 址 ， 即 这 个 地 址 可 以 
被 2 整除。 假设 设计 了 四 字 节 数据 总 线 来 进一步 提高 性 能 ， 那 么 就 需要 4 个 内 存 数 据 寄存 
器 : MDR0、MDR1、MDR2 和 MDR3。 图 12-17 中 的 EOMux 将 会 是 一 个 4 输入 的 复 用 器 ， 
控制 线 也 会 是 两 条 ， 而 不 是 一 条 。 图 12-17b 所 示 的 内 存 芯 片 将 会 有 32 条 数据 线 ， 而 不 是 
16 条 ,缺失 的 地 址 线 是 A0 和 A1， 而 不 仅仅 是 A0。 对 齐 命 令 


.ALIGN 4 
将 会 插入 足够 多 的 零 字 节 使 得 下 一 行 代 码 开始 于 能 被 4 整除 的 地 址 。 同 样 ， 对 齐 命 令 
.RLIGN 8 


将 会 插入 足够 多 的 零 字 节 使 得 下 一 行 代码 开始 于 能 被 8 整除 的 地 址 ， 以 适应 于 8 字 节 的 数据 
总 线 。 

图 12-22 显示 了 当 全 局 变量 存储 在 内 存 固 定位 置 时 ， 对 齐 命令 如 何 使 得 性 能 最 大 化 。 存 
储 在 运行 时 栈 的 局 部 变量 和 参数 也 同样 需要 这 个 优化 技术 。 使 用 双 字 节 数 据 总 线 时 ， 栈 指针 
的 初始 值 对 齐 于 偶 地 址 。 编 译 器 必须 生成 汇编 语言 代码 ， 可 能 会 填充 零 字 节 以 便 让 每 一 个 变 
量 在 内 存 中 都 对 齐 于 偶 地 址 边界 。 比 如 ，8.2 节 描 述 过 的 陷阱 机 制 显 示 了 系统 栈 上 的 进程 控 
制 块 。 对 于 双 字 节 数 据 总 线 ， 即 使 指令 指示 符 只 有 一 个 字 节 长 ， 它 也 会 存储 在 一 个 填充 了 一 
个 零 字 节 的 双 字 节 单元 中 。 每 个 寄存 器 都 存储 在 偶 地 址 上 ，NZVC 位 也 存储 在 一 个 双 字 节 单 
元 中 ， 其 中 填充 了 一 个 零 字 节 。 

图 12-23 显示 了 间接 寻 址 的 字 装 和 指令 的 实现 ， 使 用 了 双 字 节 总 线 设 计 。 单 元 测试 假 
定 操作 数 指示 符 是 0012， 这 个 是 偶数 ; Mem[0012] 的 值 是 26D2， 这 也 是 个 偶数 ， 因 此 假 
设 数据 对 齐 于 双 字 节 边 界 。 周 期 5 给 出 了 如 何在 一 个 周期 内 把 MDR 中 的 两 个 字 节 内 容 都 送 
入 MAR。 对 比 图 12-12， 它 用 单字 节 总 线 实现 同样 的 指令 ， 图 12-23 只 需要 两 次 内 存 访 问 ， 
而 不 是 四 次 ， 它 的 周期 总 数 是 10 而 不 是 18。 相 比 原 来 的 18 个 周期 ， 它 节省 了 8 个 周期 ， 
即 44%, 


// LDWX this,n 
// RTL: X <- Oprnd; N <- X<0, Z <- X=0 
// Indirect addressing: Oprnd = Mem[Mem[OprndSpec] ] 


UnitPre: IR=0xCA0012, Mem[0x0012]=0x26D2, Mem[0x26D2]=0x53AC 
UnitPre: N=1, Z=1, V=0, C=1 
UnitPost: X=0x53AC, N=0, Z=0, V=0, C=1 


// MDR <- Mem[(OprndSpec]. 
1. A=9, B=10, MARMux=1; MARCk 
. MemRead 


2 
3. MemRead 
4. MemRead, MDROMux=0, MDREMux=0; MDROCk, MDRECk 





// MAR <- MDR. 


图 12-23 ”用 双 字 节 总 线 实 现 间 接 寻 址 的 字 装 人 指令 
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. MARMux=0; MARCk 


MDR <- two-byte operand. 
6. MemRead 
7. MemRead 
. MemRead, MDROMux=0, MDREMux=0; MDROCk, MDRECk 


X <- MDR, high-order first. 
. EOMux=0, AMux=0, ALU=0, AndZ=0, CMux=1, C=2; NCk, ZCk, LoadCk 
. EOMux=1, AMux=0, ALU=0, AndZ=1, CMux=1, C=3; ZCk, LoadCk 


图 12-23 (4) 


用 图 12-17 所 示 的 双 字 节 数 据 总 线 正确 执行 程序 就 需要 在 内 存 中 对 齐 某 些 程序 语句 。 使 
用 宽 总 线 时 ， 分 支 语句 会 带 来 问题 ， 因 为 它们 改变 了 程序 计数 器 的 值 。 图 12-21 显示 了 PC 
为 奇数 时 冯 “ 诺 依 曼 周 期 的 取 指 部 分 。 硬 件 假定 指令 指示 符 被 预 取 并 存 人 寄存 器 T1。 假 设 
程序 分 支 的 目标 语句 存储 在 奇 地 址 ， 要 执行 目标 指令 的 冯 … 诺 依 曼 周期 硬件 将 会 访问 T1 
来 获取 指令 指示 符 ， 即 使 该 指示 符 并 未 被 预 取 。 为 了 让 使 用 这 种 硬件 的 程序 能 正确 工作 ， 分 
支 指令 的 目标 语句 定义 的 每 一 个 符号 都 必须 定位 在 偶 地 址 。 当 分 支 发 生 后 ， 程 序 计 数 器 将 变 

成 偶数 。 图 12-20 所 示 的 取 指 序列 会 正确 执行 并 取得 目标 指令 的 指令 指示 符 。 

图 12-24 给 出 了 图 6.8 中 程序 所 需 的 程序 对 齐 。 图 12-24a 显示 到 main 的 初始 分 支 会 
分 支 到 位 于 0003 的 指令 ， 这 是 个 奇 地 址 。 图 12-24b 中 的 .ALIGN 语句 解决 了 这 个 问题 ， 
它 强制 主 程序 代码 开始 于 0004， 这 是 偶 地 址 。 必 须 在 每 个 函数 (包括 main) 的 开头 都 插 
入 ALIGN 语句 。 该 程序 还 有 两 个 其 他 的 分 支 目 标 : 让 和 endif。 要 强制 这 些 语句 位 于 偶 地 
址 ， 汇 编 器 必须 在 每 个 目标 指令 的 前 面 插入 非 一 元 无 操作 指令 NOP0。 在 Pep/9 F, NOPO 
指令 是 一 条 陷阱 指令 ， 因 此 会 导致 性 能 大 幅 下 降 ， 从 而 抵消 了 宽 数 据 总 线 带 来 的 好 处 。 所 有 
真实 的 处 理 器 都 有 原生 的 无 操作 指令 ， 这 些 指令 在 一 个 周期 内 执行 用 于 程序 语句 对 齐 。 





0000 120004 BR main 
limit: . EQUATE 100 
num: . EQUATE 0 
120003 BR 
. EQUATE 
- EQUATE 


00 . ALIGN 
580002 main: SUBSP 
330000 DECI 
C30000 if: LDWA 
A00064 CPWA 
16001A BRLT 
490022 STRO 
12001E BR 

26 NOPO 
490028 else: STRO 
26 NOPO 
500002 endIf: ADDSP 
00 STOP 


a) 无 程序 对 齐 b) 有 程序 对 齐 
图 12-24 图 6-8 中 程序 的 程序 对 齐 


580002 SUBSP 2,2. 
330000 DECI num, S 
C30000 if: LDWA num,s 
A00064 CPWA limit,i 
160018 BRLT else 
49001F STRO msgl,d 
12001B BR endIf 
490025 STRO msg2,d 
500002 ADDSP 2i 

00 STOP 
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另外 两 条 修改 程序 计数 器 的 语句 是 call 和 ret. call 语句 是 三 字 节 的 指令 ， 把 已 增加 过 的 
程序 计数 器 人 运行 时 栈 当 作 和 返回 地 址 。ret 语句 分 支 到 该 地 址 。 因 此 ，call 语句 后 面 的 地 址 必 
须 是 偶 地 址 。 那 么 ， 每 个 call 语句 都 会 在 奇 地 址 ， 永 远 不 能 成 为 分 支 指令 的 目标 。 要 修复 包 
RILE call 语句 的 程序 ， 就 必须 使 得 分 支 指 向 call 之 前 的 ， 位 于 偶 地 址 的 无 操作 指令 。 


12.2.3 A 位 计算 机 的 定义 


得 到 普遍 接受 的 “nn 位 计算 机 ”的 意思 是 为 MAR 和 在 ISA3 层 可 见 的 CPU 寄存 器 的 
位 数 。 因 为 ISA3 层 可 见 的 寄存 器 可 以 存放 地 址 ， 它 们 的 宽度 通常 和 MAR 一 样 ， 所 以 这 个 
定义 没有 歧义 。 比 如 ，Pep/9 显然 是 个 16 位 计算 机 ， 因 为 ISA3 层 上 用 于 存储 数据 的 可 见 寄 
存 器 如 累加 器 和 变 址 寄存 器 ， 是 16 位 单元 。 此 外 ， 存 储 地 址 的 寄存 器 如 程序 计数 器 和 栈 指 
针 ， 也 是 16 位 单元 。 

关于 这 个 定义 的 疑虑 经 常 出 现在 市 场 上 。 n 位 计算 机 的 CPU 数据 区 不 一 定 有 nn 位 数据 
总 线 ，LG1 层 的 寄存 絮 组 中 的 寄存 器 也 不 一 定 有 位。 这 些 宽度 都 可 以 小 于 n。Pep/9 就 是 
这 种 计算 机 的 一 个 例子 ， 虽然 它 是 一 个 16 位 机 器 ,但 ABus、BBus fil CBus 的 宽度 只 有 8 
位 。 在 Mc2 BEE, 寄存 器 组 中 的 寄存 器 也 只 有 8 位 宽 。 

一 个 经 典 的 例子 是 1964 年 开始 的 IBM 360 系列 ， 这 是 第 一 个 计算 机 系列 ， 它 们 的 模型 
具有 同样 的 ISA3 指令 集 和 寄存 器 。 它 是 32 位 机 器 ， 但 是 根据 模型 的 不 同 ，CPU 中 的 数据 
总 线 可 以 是 8 位 、16 位 和 32 位 。 因 为 LG1 层 细 节 对 ISA3 层 的 程序 员 是 隐藏 的 ， 所 以 在 系 
列 中 某 个 模型 上 编写 和 调试 的 所 有 软件 都 可 以 在 另 一 个 模型 上 运行 ， 无 须 改 变 。 唯 一 可 以 感 
觉 到 的 模型 之 间 的 区 别 是 以 执行 时 间 测 量 的 性 能 。 这 个 概念 在 当时 是 革命 性 的 ， 基 于 抽象 层 
次 的 概念 提升 了 计算 机 的 设计 。 

nn 位 计算 机 的 主 系统 总 线 也 不 一 定 有 n 
条 地 址 线 ，MAR 的 宽度 确定 了 系统 最 多 能 
访问 的 可 寻 址 字 节 数 上 限 。 如 图 12-25 所 
示 , 一 个 n 字 节 的 计算 机 可 以 访问 2 个 字 
节 。 例 如 ，Pep/9 有 16 位 MAR， 因 此 最 多 32 4Gi 
可 以 访问 2 个 字 节 ， 相 当 于 64KiB。 64 17,179,869,184 Gi 

现在 许多 笔记 本 计算 机 都 有 64 位 处 
理 器 ， 理 论 上 最 大 主 存 容量 为 2 个 字 节 ， 
或 17 179 869 184GiB。 因 为 物理 上 是 不 
可 能 安装 这 么 大 的 主 存 ， 所 以 这 样 的 系统 只 是 告知 一 个 最 大 的 主 存 容量 ， 并 在 系统 中 设计 
相应 的 地 址 总 线条 数 。 例 如 ， 假 设计 算 机 制造 商 发 布 了 64 位 计算 机 ， 可 以 安装 的 最 大 内 存 
容量 为 32GiB。 由 于 CPU Æ 64 位 处 理 器 ， 其 内 部 MAR 是 64 位 宽 。 但 是 为 了 节省 电路 板 
上 的 空间 ， 制 造 商 设计 的 系统 总 线 只 有 35 条 地 址 线 与 MAR 的 AO ~ A34 连接 。MAR 的 
A35 ~ A63 是 没有 连接 的 。 而 2” 个 字 节 是 32GiB， 所 以 这 个 产品 允许 用 户 安装 的 最 大 内 存 
容量 就 是 32GiB。 

主 系统 总 线 的 数据 线条 数 甚至 可 能 大 于 ns。 例如 ，Pep/9 是 16 位 计算 机 ， 但 可 以 有 32 
位 宽 的 数据 总 线 ， 每 次 内 存 读 都 可 以 取得 8 个 字 节 。 图 12-20 所 示 的 微 代码 序列 预 取 额 外 字 
节 来 消除 之 后 对 内 存 访 问 的 需求 ， 与 之 类 似 ，8 字 节 内 存 访问 中 所 有 未 被 使 用 的 字 节 都 可 以 
存储 在 CPU 中 ， 以 便 消 除 未 来 可 能 的 一 些 内 存 访问 。 预 取 比 需要 更 多 的 数据 来 消除 未 来 的 





12-25 最 大 内 存 访问 限制 是 MAR 宽度 的 函数 
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内 存 访问 是 下 一 小 节 描 述 的 高 速 缓存 的 基础 。 

如 果 内 部 寄存 器 、 内 部 总 线 以 及 系统 总 线 上 的 数据 / 地址 总 线 的 宽度 都 是 一 样 的 ， 那 
么 ， 增 加 这 个 宽度 就 能 提高 性 能 。 可 以 看 到 增加 这 些 组 
件 的 宽度 对 芯片 大 小 有 很 大 影响 。 所 有 的 电路 ， 包 括 
ALU、 复 用 器 和 寄存 器 ， 都 必须 增加 以 和 更 大 的 宽度 L 
匹配 。 计 算 机 的 历史 显示 总 线 和 寄存 器 在 不 断 地 变 宽 。 eon Sent, ae 






图 12-26 展示 的 是 Intel CPU 如 何 把 总 线 宽度 从 4 位 增 aT a 
加 至 64 (ii. 4004 是 第 一 个 片上 微 处 理 器 ， 第 一 个 Intel 8086 1978 16-bit 
64 位 处 理 器 是 Pentium 4 芯片 的 一 个 版 本 。 市 场 正在 完 80386 1985 32-bit 
MM 32 位 机 器 到 64 位 机 器 的 过 渡 。 目 前 ， 大 多 数 台 式 x86-64 2004 64-bit 
机 和 笔记 本 电脑 都 是 64 位 处 理 器 ， 而 大 多 数 移动 设备 


图 12-26 寄存 器 / 总线 宽 度 的 演进 
都 是 32 位 处 理 器 。 


带 来 这 种 变化 的 原因 可 能 仅仅 是 技术 以 一 种 稳定 的 
速度 在 发 展 。Gordon Moore, Intel 的 创始 人 ,在 1965 年 观察 到 集成 电路 上 晶体 管 的 密度 每 
年 都 会 翻番 ， 而 且 在 可 预见 的 未 来 还 会 继续 如 此 。 这 个 速度 现在 有 些 减 缓 了 ， 所 谓 的 摩尔 定 
律 是 指 集成 电路 上 晶体 管 的 密度 每 18 个 月 会 翻番 。 这 个 速度 不 会 永远 保持 ， 因 为 这 种 变 小 
化 最 终 会 到 达 原 子 的 尺度 ， 而 原子 是 无 法 再 分 割 的 了 。 人 们 一 直 在 热烈 讨论 摩尔 定律 具体 什 
么 时 候 会 停止 ， 许 多 人 预测 它 会 消亡 ， 结 果 发 现 它 还 在 继续 。 

推动 64 位 计算 机 的 最 大 动力 是 因为 多 媒体 应 用 和 大 型 数据 库 需 要 大 于 4 GiB 的 地 址 空 
间 。64 位 计算 机 可 能 是 最 后 的 诉求 ， 因 为 64 位 地 址 线 可 以 访问 160 亿 GiB。 从 一 代 到 下 一 
代 的 增长 不 是 线性 的 ， 而 是 指数 性 的 。 曾 经 有 很 多 年 ，32 位 计算 机 有 32 位 的 MAR， 但 是 
主 存 总 线 只 有 24 条 地 址 线 ， 高 位 的 8 个 地 址 位 被 忽略 。 用 户 可 以 在 这 样 的 机 器 上 安装 最 多 
16MiB (2”) 内 存 ， 这 在 当时 已 经 足够 大 了 。 未 来 在 64 位 计算 机 上 也 是 一 样 的 ， 根 据 市 场 
需要 ， 外 部 地 址 线 的 数量 会 小 于 MAR 的 内 部 宽度 。 


12.2.4 ”高 速 缓存 

Pep/9 控制 序列 要 求 内 存 读 和 写 需要 3 个 周期 ， 因 为 通过 主 系统 总 线 访 问 内 存 子 系统 要 
花费 额外 的 时 间 。 虽 然 这 个 要 求 使 得 模型 更 现实 ， 但 是 实际 上 主 存 访问 时 间 和 CPU 周期 时 
间 之 间 速 度 的 不 匹配 要 更 严重 。 假 设 主 存 访问 需要 10 个 周期 而 不 是 3 个 周期 ， 想 象 一 下 控 
制 序列 看 上 去 会 像 什 么 样子 : 很 多 个 MemReads 周期 。 大 部 分 时 间 中 CPU 在 等 待 内 存 读 ， 
浪费 了 本 来 可 以 用 来 推进 作业 执行 的 周期 。 

但 是 如 果 可 以 预测 未 来 呢 ? 如 果 提 前 知道 程序 需要 从 内 存 来 的 哪个 字 ， 那 么 可 以 设立 一 
个 更 贵 、 速 度 更 高 的 小 存储 器 ， 使 其 紧邻 着 CPU ， 称 为 高 速 缓存 ( cache)， 提 前 从 主 存 取出 
指令 和 数据 ， 从 而 可 以 立即 为 数据 区 所 用 。 当 然 ， 没 有 人 能 预测 未 来 ， 所 以 这 种 机 制 是 不 可 
能 的 。 不 过 ， 即 使 不 能 100% 准确 地 预测 未 来 ， 如 果 能 达到 95% 的 准确 率 呢 ? 当 预测 准确 
时 ， 访 问 高 速 缓存 的 时 间 几 乎 是 立即 的 。 如 果 预 测 准确 的 比率 足够 高 ， 节 约 的 时 间 比 就 会 很 
可 观 了 。 

问题 是 如 何 进行 预测 。 假 设 能 够 监控 地 址 线 和 CPU 在 执行 典型 任务 时 的 所 有 内 存 请 求 ， 
那么 会 发 现 地 址 序列 是 完全 随机 的 吗 ? 也 就 是 给 定 一 个 地 址 请 求 后 ， 可 以 预期 下 一 个 请 求 与 
这 一 个 邻近 吗 ? 或 者 预期 它 与 这 个 请 求 的 距离 是 完全 随机 的 ? 
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预期 连续 的 内 存 请 求 会 彼此 接近 是 基于 内 存 中 存储 的 两 样 东西 ， 原 因 也 有 两 个 。 首 先 ， 
CPU 27675 + 诺 依 曼 周 期 的 取 指 部 分 访问 指令 ， 只 要 没有 分 支 指令 要 执行 距离 远 的 指令 ， 
CPU 就 会 请 求 聚 集 在 一 起 的 指令 。 其 次 ，CPU 必须 访问 来 自 内 存 的 数据 。 不 过 第 6 章 中 的 
汇编 语言 程序 都 会 把 它们 的 数据 在 内 存 中 聚集 存放 。 应 用 程序 和 堆 存 放 在 内 存 低 地 址 ， 操 
作 系 统 和 运行 时 栈 存放 在 高 地 址 。 不 过 也 应 该 注意 到 ， 在 某 些 时 间 段 访问 会 集中 在 邻近 的 
地 方 。 

内 存 访 问 并 不 是 随机 的 ， 这 个 现象 称 为 引用 局 部 性 (locality of reference)。 如 果 内 存 访 
问 是 完全 随机 的 ,那么 高 速 缓存 就 完全 没有 用 ， 因 为 无 法 预测 要 从 内 存 读 哪些 字 节 ， 也 就 无 
从 预先 装 入 。 幸 运 的 是 典型 的 访问 会 展现 出 两 类 局 部 性 : 

e 空间 局 部 性 : 与 之 前 请 求 过 的 地 址 邻近 的 地 址 很 有 可 能 在 临近 的 未 来 再 被 请 求 。 

e 时 间 局 部 性 : 之 前 请 求 过 的 地 址 本 身 在 临近 的 未 来 很 有 可 能 再 被 请 求 。 

时 间 局 部 性 来 自 于 程序 中 经 常 使 用 的 循环 。 

当 CPU 请 求 来 自 于 内 存 的 装 入 时 ， 高 速 缓存 子 系统 首先 查看 所 请 求 的 数据 是 否 已 经 装 
和 高速 缓存 ， 这 个 事件 称 为 高 速 缓存 命中 (cache hit)， 如 果 是 这 样 ， 就 直接 传送 数据 。 如 果 
不 是 ， 则 发 生 高 速 缓存 不 命中 (cache miss) 事件 ， 需 从 主 存 取出 数据 ，CPU 必须 等 待 更 长 
的 时 间 。 当 数据 最 终 到 达 时 ， 会 被 装 人 高 速 缓存 并 送 给 CPU。 因 为 数据 刚刚 被 请 求 过 ， 所 
以 有 很 高 的 概率 在 不 远 的 将 来 再 被 请 求 。 把 这 样 的 数据 保存 在 高 速 缓存 中 利用 了 时 间 局 部 
性 。 不 仅 把 所 请 求 的 数据 放 进 高 速 缓存 ， 还 把 所 请 求 的 字 节 附近 的 一 些 字 节 也 装 人 其 中 ， 这 
利用 了 空间 局 部 性 。 虽 然 装 人 了 一 些 没 有 被 请 求 的 字 节 ,但 这 是 基于 对 未 来 的 预测 进行 的 预 
先 装 人。 在 不 远 的 将 来 访问 它们 的 概率 很 高 ， 因 为 它们 的 地 址 与 前 面 访问 过 字 节 的 地 址 距离 
很 近 。 

为 什么 不 用 像 高 速 缓存 这 样 的 高 速 电路 构建 主 存 ， 把 它 放 在 高 速 缓存 的 位 置 ， 也 就 不 需 
要 高 速 缓存 了 ? 这 是 因为 高 速 内 存 电路 需要 在 芯片 上 占用 太 多 面积 。 最 快 和 最 慢 的 内 存 技术 
之 间 有 巨大 的 大 小 和 速度 的 差别 ， 这 是 经 典 的 空间 /时 间 折 中 。 每 个 存储 单元 的 空间 越 大 ， 
内 存 操作 的 速度 就 越 快 。 

内 存 技术 在 这 两 种 极端 之 间 提 供 了 多 种 设计 ， 其 中 在 CPU 和 主 存 子 系统 之 间 使 用 三 层 
高 速 缓存 是 最 典型 的 情况 : 

e 分 离 的 Ll 指令 和 数据 高 速 缓存 : 最 小 、 最 快 、 距 离 CPU 最 近 。 

e 统一 的 L2 高 速 缓存 : 在 Ll 和 L3 高 速 缓 存 之 间 。 

o 统一 的 L3 高 速 缓存 : 最 大 、 最 慢 、 距 离 CPU 最 远 。 

图 12-27 给 出 了 一 个 四 核 CPU 中 的 三 层 高 速 缓 存 结构 。 图 中 ， 虚 线 表 示 单 个 封装 的 边 
界 ， 单 个 封装 是 指 安 装 在 计算 机 系统 电路 板 上 的 单个 部 件 。L1 高 速 缓存 比 L2 高 速 缓存 更 小 
更 快 ，L2 高 速 缓存 又 比 L3 高 速 缓存 更 小 更 快 ， 而 L3 又 比 主 存 子 系统 更 小 更 快 。L1 高 速 缓 
存 的 典型 大 小 是 32KiB 或 64KiB。( 说 明 一 下 Pep/9 有 多 小 ， 它 的 整个 内 存 正好 能 装 进 一 个 
典型 的 L1 高 速 缓存 中 。) L1 高 速 缓存 必须 按照 CPU 的 速度 运行 ，L2 高 速 缓存 的 速度 通常 是 
L1 的 1/2 或 14， 时 间 是 后 者 的 2 一 4 倍 。L3 通常 又 比 L2 慢 和 大 了 4 到 8 倍 。 与 主 存 相 邻 
的 高 速 缓存 也 被 称 为 最 后 一 级 高 速 缓存 。 有 些 设计 完全 省 略 了 L3 高 速 缓存 ， 而 其 他 设计 则 
有 三 层 以 上 的 高 速 缓存 。 

CPU 会 区 分 汉 : 诺 依 曼 周期 的 取 指 令 和 取 操 作 数 的 取 数 据 。 因 此 ，L1 高 速 缓存 分 成 了 
指令 高 速 缓存 和 数据 高 速 缓 存 。L1 高 速 缓存 收 到 来 自 CPU 的 内 存 请 求 ， 如 果 高 速 缓存 不 命 
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中 ， 再 把 请 求 传递 到 L2 缓存 。L2 高 速 缓存 被 称 为 高 速 ， 因 为 它 对 指令 和 数据 不 做 区 分 ， 混 
合 存储 。 每 个 内 核 都 有 自己 的 L2 高 速 缓存 。 如 果 L2 缓存 不 命中 ， 就 再 传递 到 L3。L3 高 速 
缓存 是 所 有 内 核 共享 的 统一 高 速 缓 在， 如果 L3 不 命中 ， 就 传递 到 主 存 子 系统 。 
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图 12-27 一 个 典型 计算 机 系统 中 的 三 层 高 速 缓存 结构 

有 两 种 高 速 缓 存 设计 方法 : 

e 直接 映射 高 速 缓 存 。 

e 组 相 联 高 速 缓存 。 

两 者 中 比较 简单 的 是 直接 映射 高 速 缓存 ， 图 12-28 是 一 个 例子 。 和 前 面 的 例子 一 样 ， 这 
个 例子 小 得 不 切实 际 ， 以 帮助 进行 描述 。 

这 个 例子 是 一 个 具有 16 条 地 址 线 和 2564KiB 主 存 的 系统 。 内 存 被 划分 成 16 字 节 的 
块 ， 称 为 高 速 缓存 行 。 当 发 生 高 速 缓存 不 命中 时 ， 系 统 不 仅 会 装 人 所 请 求 的 字 节 ， 还 会 装 
人 包含 这 个 被 请 求 的 字 节 所 在 高 速 缓存 行 的 所 有 16 个 字 节 。 高 速 缓存 是 一 个 有 8 个 单元 的 
小 型 存储 器 ， 地 址 从 0 ~ 7。 每 个 单元 分 为 三 个 字段 : 有 效 位 ( Valid)、 标 签 (Tag) 和 数据 
( Data)。 数 据 字 段 是 高 速 缓存 单元 的 一 部 分 ， 存放 来 自 内 存 的 高 速 缓存 行 的 副本 。 有 效 位 字 
段 是 一 位 ， 如 果 高 速 缓存 单元 包含 有 效 的 来 自 内 存 的 高 速 缓存 行 ， 那 么 该 位 为 1， 否则 为 0。 

地 址 字段 分 为 三 个 部 分 : 标签 (Tag)、 fF (Line) 和 字 节 ( Byte)。 字 节 字 段 是 4 位 ， 对 
应 于 2 =16， 所 以 高 速 缓存 的 每 一 行 有 16 个 字 节 。 行 字段 是 3 位 ， 对 应 于 2=8， 所 以 高 速 
缓存 中 有 8 个 单元 。 标 签字 段 包 含 16 位 地 址 剩 下 的 位 ， 所 以 它 有 16-3-4=9 位 。 高 速 缓存 
单元 包含 来 自 地 址 的 标签 字段 和 来 自 内 存 的 数据 。 在 这 个 例子 中 ， 每 个 高 速 缓存 单元 占用 一 
共 1+9+128=138 位 。 因 为 高 速 缓存 中 有 8 个 单元 ， 所 以 总 共有 138 x 8 = 1104 fiz. 
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图 12-28 ”直接 映射 高 速 缓存 


图 12-29 给 出 了 直接 映射 高 速 缓存 操作 的 伪 代 码 描述 。 当 系统 启动 后 ， 会 把 高 速 缓存 中 
的 所 有 有 效 位 设置 为 0。 第 一 次 内 存 请 求 将 不 命中 。 来 自 内 存 的 高 速 缓存 行 的 地 址 被 装 和 人 地 
址 标签 字段 ， 最 后 4 位 被 设置 为 0 ; 从 内 存 取出 该 行 ， 并 存在 高 速 缓存 单元 中 ， 设 置 有 效 位 
为 1; 还 会 从 地 址 中 提取 出 标签 字段 并 存储 。 


Extract the Line field from the CPU memory address request 
Retrieve the Valid/Tag/Data cache entry from the Line row 
if (Valid == 0) { 

Cache miss, memory fetch 


} else if (Tag fromcache != Tag from memory request) { 
Cache miss, memory fetch 

} else { 
Cache hit, use Data field from cache 

} 





图 12-29 ”直接 映射 高 速 缓存 操作 的 伪 代 码 描述 


如 果 另 一 个 请 求 要 求 同 一 行 中 的 字 节 则 会 命中 。 系 统 从 该 地 址 提取 出 行 字段 ， 查 看 高 速 
缓存 中 的 该 行 ， 确 定 有 效 位 为 1， 请 求 的 标签 字段 与 高 速 缓存 单元 的 标签 一 致 。 系 统 从 高 速 
缓存 单元 的 数据 部 分 取出 该 字 节 或 者 字 ， 并 送 到 CPU， 不 需要 读 内 存 。 如 果 有 效 位 为 1, 但 
是 标签 字段 不 匹配 ， 就 是 不 命中 ， 需 要 进行 内 存 请 求 ， 新 的 标签 和 数据 字段 替代 同一 高 速 组 
存单 元 中 旧 的 标签 和 数据 字段 。 
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my CPU 请 求 地 址 3519 (dec) 的 字 节 。 标 签字 段 的 9 位 是 什么 ? 字 节 字段 的 4 位 
是 什么 ?数据 会 存储 在 高 速 缓存 的 哪个 单元 ?转换 为 二 进 制 并 抽取 出 相应 的 字段 得 到 

3519 (dec) =000011011 011 1111 (bin) 

标签 字段 的 9 位 是 000011011， 字 节 字 段 的 4 位 是 1111， 而 数据 存储 在 高 速 缓存 中 的 地 
址 是 011 (bin) =3 (dec). n 

图 12-28 给 出 内 存在 地 址 16,144,272,… 的 块 ， 它 们 都 在 竞争 高 速 缓存 中 的 同一 个 位 置 ， 
即 地 址 为 1 的 条 目 。 由 于 标签 字段 有 9 位， 因此 高 速 缓存 中 每 个 条 目 在 内 存 中 都 有 2”=512 
块 竞争 ， 而 每 个 条 目 每 次 只 能 放下 一 块 。 有 一 种 请 求 模式 会 导致 很 高 的 命中 率 ， 这 个 模式 是 
在 内 存 中 两 个 固定 的 区 域 之 间 来 回访 问 。 一 个 例子 是 一 个 程序 有 几 个 指针 ， 指 向 Pep/9 内 存 
高 地 址 的 运行 时 栈 和 内 存 低地 址 的 堆 。 访问 指针 和 它们 指向 的 单元 的 程序 就 会 具有 上 述 访问 
模式 。 如 果 指 针 和 它们 指向 的 单元 的 地 址 有 同样 的 行 字段 ， 不 命中 率 就 会 急剧 升 高 。 

组 相 联 高 速 缓存 用 于 减轻 这 个 问题 。 并 不 是 每 个 高 速 缓存 条 目 都 只 能 存放 来 自 内 存 的 
一 个 高 速 缓存 行 ， 而 是 可 以 存放 多 个 行 。 图 12-30a 描述 的 是 一 个 四 路 组 相 联 高 速 缓存 ， 把 
图 12-29 中 的 高 速 缓存 复制 了 四 次 ， 任 何 时 候 都 允许 一 组 最 多 四 个 具有 相同 行 字段 的 内 存 块 
存放 在 高 速 缓存 中 。 这 个 访问 电路 比 直接 映射 高 速 缓存 的 电路 更 复杂 。 对 于 每 个 读 请 求 ， 硬 
件 必须 并 行 地 检查 高 速 缓存 单元 的 四 个 部 分 ， 如 果 有 匹配 的 ， 就 返回 行 字段 匹配 的 那 一 个 。 

图 12-33b 给 出 了 读 电 路 的 细节 。 有 等 号 的 圆圈 是 比较 器 ， 如 果 输 入 相等 ， 就 输出 1， 
否则 输出 0。 这 里 的 128 复 用 器 组 比 通常 的 简单 。 四 输入 复 用 器 通常 有 两 个 选择 线 需要 译 
码 , 但 是 这 个 复 用 器 的 四 条 选择 线 已 经 译 码 了 。 标号 为 “命中 ”的 输出 在 命中 时 为 1， 此 时 ， 
标号 为 “数据 ”的 输出 是 来 自 高 速 缓存 行 的 数据 ， 该 行 的 标签 字段 和 请 求 的 地 址 的 标签 字段 
相同 。 否 则 ,命中 输出 为 0。 

使 用 组 相 联 高 速 缓存 的 另 一 个 麻烦 是 当 高 速 缓存 不 命中 发 生 时 ， 缓 存单 元 的 四 个 部 分 都 
是 被 占用 的 ,需要 做 出 决定 。 问 题 是 ， 四 个 部 分 中 的 哪 一 个 该 被 来 自 内 存 的 新 数据 覆盖 呢 ? 
一 项 技术 是 最 近 最 少 被 使 用 ( LRU) 算法 。 在 一 个 两 路 组 相 联 高 速 缓存 中 ， 每 个 缓存 单元 只 
需要 再 增加 一 位 ， 就 可 记录 哪个 单元 最 近 最 少 被 使 用 。 但 是 在 一 个 四 路 组 相 联 高 速 缓存 中 ， 
要 记录 最 近 最 少 被 使 用 就 复杂 得 多 了 。 必 须 维 护 按照 使 用 顺序 排列 的 四 个 条 目 列表 ， 而 且 每 
次 高 速 缓存 请 求 都 要 更 新 这 个 列表 。 四 路 高 速 缓存 的 一 种 近似 LRU 方法 是 使 用 三 位 ， 一 位 
表明 哪个 组 最 近 最 少 被 使 用 ， 每 个 组 内 的 位 表明 该 组 中 哪个 条 目 最 近 最 少 被 使 用 。 

无 论 高 速 缓存 是 直接 映射 还 是 组 相 联 ， 系 统 设计 者 都 必须 决定 如 何 处 理 有 高 速 缓存 情况 
下 的 内 存 写 。 高 速 缓存 命中 时 ， 有 两 种 可 能 性 : 

e 通 写 (write through): 每 个 写 请 求 会 更 新 高 速 缓存 和 相应 的 内 存 块 。 

e 回 写 ( write back) : 写 请 求 只 更 新 高 速 缓 存 中 的 副本 。 对 内 存 的 写 只 有 在 该 高 速 缓存 

行 被 蔡 换 时 才 发 生 。 

图 12-31 描述 了 这 两 种 可 能 性 。 通 写 是 比较 简单 的 设计 ， 当 系统 要 写 内 存 时 ，CPU 会 继 
续 处 理 。 当 高 速 缓存 行 需 要 被 蔡 换 时 ， 内 存 中 的 值 保 证 已 经 是 最 近 的 更 新 了 。 这 样 做 的 问题 
是 ， 当 写 请 求 突 发 时 ， 总 线 上 的 流量 会 很 大 。 回 写 策略 降低 了 总 线 流量 ， 否 则 这 些 总 线 流量 
可 能 会 影响 其 他 想 使 用 主 系统 总 线 的 部 件 的 性 能 。 不 过 在 任何 给 定 的 时 刻 ， 内 存 中 不 一 定 具 
有 变量 当前 值 的 最 新 副本 。 同 时 ， 当 要 替换 某 个 高 速 缓存 行 时 ， 会 有 一 定 的 延迟 ， 因 为 要 先 
更 新 内 存 ， 才 能 把 新 数据 装 入 高 速 缓存 。 通 过 设计 可 使 高 速 缓存 命中 率 很 高 ， 这 样 的 事件 不 
会 经 常 发 生 。 
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命中 


b ) 读 电 路 的 实现 
图 12-30 ”四 路 组 相 联 高 速 缓存 


关于 高 速 缓存 另 一 个 要 解决 的 问题 是 当 高 速 缓存 不 命中 时 ， 该 如 何 处 理 写 请 求 。 一 种 称 
为 写 分 配 的 策略 把 块 从 内 存 装 人 高 速 缓存 ， 可 能 会 替换 另 一 个 高 速 缓存 行 ， 然 后 按照 正常 的 
高 速 缓存 写 策 略 更 新 这 一 行 。 若 不 采用 写 分 配 ， 就 会 绕 过 高 速 缓 存 发 起 一 个 内 存 写 。 这 里 的 
主要 思想 是 CPU 可 以 继续 处 理 过 程 ， 内 存 写 可 以 并 发 地 完成 。 

图 12-32 给 出 的 是 使 用 和 不 使 用 写 分 配 的 高 速 缓存 写 策略 。 虽 然 每 种 高 速 缓存 不 命中 时 
的 写 策略 可 以 和 任意 一 种 高 速 缓存 命 中 时 的 写 策略 组 合 ， 但 是 写 分 配 通常 和 高 速 缓存 命中 时 
的 回 写 一 起 使 用 ， 而 通 写 高 速 缓存 通常 不 使 用 写 分 配 ， 以 保持 设计 简单 。 大 多 数 高 速 缓存 的 
设计 选择 要 么 是 图 12-31a 和 图 12-32a， 要 么 是 图 12-31b 和 图 12-32b。 
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每 次 写 每 次 写 
CPU Cache Mem CPU Cache 
替换 时 替换 时 
a) 通 写 b) AS 


图 12-31 高 速 缓存 命中 时 的 高 速 缓存 写 策略 


CPU Cache 


a ai | fe 
HE oe a 


a) 不 写 分 配 b) 写 分 配 
图 12-32 高速 缓存 不 命中 时 的 高 速 缓 存 写 策略 


如 果 你 读 过 9.2 节 中 有 关 虚 拟 内 存 的 讨论 . 那么 有 关 高 速 缓冲 存储 器 的 讨论 应 该 听 起 来 
很 耳 熟 。 虚 拟 内 存 背 后 的 动机 也 是 一 样 的 ， 即 较 小 的 主 存 和 存储 在 硬盘 上 的 可 执行 程序 的 大 
小 之 间 的 不 匹配 ， 而 高 速 缓存 背后 的 动机 是 较 小 的 高 速 缓存 和 主 存 大 小 之 间 的 不 匹配 。 虚 拟 
内 存 中 的 LRU 页 替换 策略 对 应 于 高 速 缓存 行 的 LRU 替换 策略 。 高 速 缓存 之 于 主 存 就 像 主 存 
之 于 磁盘 。 在 这 两 种 情况 中 ， 都 有 一 个 跨越 两 层 的 内 存 层 次 结构 (memory hierarchy)， 包 括 
一 个 小 但 高 速 的 内 存 子 系统 和 必须 与 之 接口 的 一 个 大 但 慢 速 的 内 存 子 系统 。 两 个 层次 结构 中 
设计 方案 都 依赖 于 引用 局 部 性 。 两 个 领域 中 的 设计 有 共同 的 问题 和 解决 方案 ， 这 不 是 巧合 。 
这 些 原理 是 普 适 的 ， 另 一 个 证 明 是 软件 中 的 哈 希 表 数 据 结 构 。 在 图 12-28 中 可 以 看 出 从 主 存 
到 高 速 缓存 的 映射 实际 上 是 一 个 哈 希 函数 。 组 相 联 高 速 缓 存 甚至 看 上 去 就 很 像 哈 希 表 ， 它 通 
过 链表 解决 冲突 ， 只 不 过 链表 的 长 度 有 上 限 。 


12.2.5 系统 性 能 公式 


衡量 一 台 机 器 性 能 的 最 终 指标 是 它 执行 起 来 有 多 快 。 图 12-33 中 的 系统 性 的 方式 说 明 机 
器 执行 程序 的 时 间 是 三 个 因子 的 乘积 。 公 式 中 使 用 的 “指令 ” 指 的 是 ISA3 层 的 指令 ， 使 用 
的 “周期 ” 指 的 是 汉 “' 诸 依 曼 周 期 。 
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时 间  _ 指 全 数 ”” 时 钟 同期 数 、 _ 时间 
程序 ” 程序 指令 时 钟 同期 











通过 流水 线 缩短 执行 周期 
进行 最 小 化 


图 12-33 5 ' 诺 依 曼 机 器 的 系统 性 能 公式 





通过 执行 周期 多 的 功能 强 通过 执行 周期 少 的 简 
大 的 复杂 指令 进行 最 小 化 单 指令 进行 最 小 化 





前 两 个 因子 之 间 有 关联 ， 但 是 与 第 三 个 因子 无 关 。 第 一 个 因子 下 降 通 常会 导致 第 二 个 因 
子 上 升 ， 反 之 亦 然 。 也 就 是 说 ， 如 果 设 计 ISA3 机 器 的 方法 导致 执行 一 个 给 定 程序 的 指令 数 
减少 ,那么 通常 会 付出 执行 每 条 指令 的 周期 数 增加 的 代价 。 反 过 来 ， 如 果 设 计 ISA3 机 器 导 
致 每 条 指令 使 用 的 周期 数 尽 可 能 少 ， 通 常 就 必须 让 指令 尽量 简单 ， 就 会 使 得 执行 一 个 给 定 的 
程序 需要 更 多 的 指令 。 

公式 中 的 第 三 个 因子 是 基于 并 行 性 的 ， 需 要 重新 组 织 控制 区 ， 使 得 集成 电路 上 更 多 的 子 
系统 能 够 并 发 地 运行 。 不 过 ， 它 和 前 面 两 个 因子 之 间 没 有 折 中 关系 。 可 以 在 设计 中 引入 流水 
线 ， 降 低 每 个 周期 的 时 间 ， 每 个 程序 所 需 的 时 间 都 会 降低 ， 而 不 管 是 选择 以 第 二 个 因子 为 代 
价 减 小 第 一 个 因子 ， 还 是 以 第 一 个 因子 为 代价 减 小 第 二 个 因子 。 


12.2.6 RISC 与 CISC 


在 计算 历史 的 早期 , 设计 者 的 注意 力 集中 于 第 一 个 因子 。 采 用 这 种 方法 的 部 分 原因 是 主 
存 的 成 本 太 高 。 程 序 需要 尽 可 能 小 ， 才 能 装 进 可 用 的 内 存 中 。 指 令 集 和 寻 址 方式 的 设计 需 使 
编译 器 能 很 容易 地 从 HOL6 翻译 到 Asmb5。Pep/9 就 是 这 种 设计 的 示例 。 而 这 里 主要 是 出 于 
教学 的 原因 ， 而 不 是 因为 主 存 有 限 。 汇 编 语 言 用 于 讲授 计算 机 系统 中 典型 抽象 层次 之 间 的 翻 
译 原 理 。 翻 译 过 程 简单 的 话 ， 这 些 原理 学 习 起 来 就 容易 。 

在 20 世纪 80 年 代 早 期 计算 领域 发 生 了 变化 。 硬 件 变 得 越 来 越 便宜 ， 内 存 子 系统 变 得 
越 来 越 大 。 一 些 设计 者 ， 著 名 的 有 IBM 的 John Cocke, UC Berkeley 的 David Patterson 和 
Stanford 的 John Hennessy， 开 始 宣扬 基于 以 增加 第 一 个 因子 、 降 低 第 二 个 因子 为 基础 的 设 
计 。 他 们 的 设计 特点 是 ISA3 指令 的 个 数 很 少 ， 寻 址 方式 也 较 少 。 这 种 设计 的 名 称 是 精简 指 
令 集 计 算 机 (Reduced Instruction Set Computer，RISC)。 与 之 相对 的 旧 设 计 开 始 称 作 复杂 指 
令 集 计 算 机 (Complex Instruction Set Computer，CISC ) 。 

下 面 列 出 了 RISC 设计 原则 ， 其 中 的 第 一 条 是 其 他 各 条 必须 遵守 的 主要 原则 。 

.除了 装 入 和 存储 指令 外 ， 每 条 ISA3 层 指令 都 在 一 个 周期 内 执行 。 

2. 控制 区 没有 微 代码 。 

3. 每 条 ISA3 层 指令 都 用 相同 的 长 度 。 

4. 只 有 几 种 简单 的 寻 址 方式 。 

5. 所 有 的 算术 逻辑 运算 完全 在 CPU 内 发 生 。 

6. 数据 区 是 为 了 深度 流水 线 设计 的 。 

Pep/9 虽然 是 个 小 型 处 理 器 ， 但 它 是 复杂 指令 集 计算 机 。 

第 一 条 RISC 设计 原则 是 : 除了 装 入 和 存储 指令 外 ， 每 条 ISA3 层 指令 都 在 一 个 周期 内 
执行 。 系 统 性 能 公式 中 的 第 二 个 因子 表明 ， 可 以 通过 最 小 化 单条 指令 的 周期 数 来 最 大 程度 减 


— 
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少 程序 的 执行 时 间 。RISC 设计 原则 把 这 种 技术 推 向 极致 ， 使 第 二 个 因子 正好 等 于 1。RISC 
机 器 的 每 条 ISA3 层 指令 都 是 在 一 个 周期 内 执行 的 ， 甚 至 包含 了 汉 : 庄 依 曼 周 期 的 取 指 部 分 
和 增加 部 分 。 

第 二 条 RISC 设计 原则 是 : 控制 区 没有 微 代 码 。 图 12-15 显示 了 CISC 机 器 Pep/9 的 控 
制 区 。Pep/9 的 一 条 ISA3 层 指令 执行 需要 多 个 周期 ， 因 此 ， 它 的 控制 区 必须 传送 一 系列 的 
控制 信号 到 数据 区 。RISC 机 器 则 完全 省 略 了 Mc2 层 ， 因 为 不 再 需要 用 一 系列 的 控制 信号 来 
驱动 数据 区 。 

第 三 条 RISC 设计 原则 是 : 每 条 ISA3 层 指令 都 用 相同 的 长 度 。Pep/9 的 汉 “ 诺 依 曼 周期 
的 取 指 部 分 取 到 指令 指示 符 ， 确 定 指令 是 否 为 一 元 的 ， 如 果 不 是 ， 就 去 取 操作 数 指示 符 。 因 
此 ， 取 指 过 程 必然 花费 一 个 以 上 的 周期 。 如 果 每 条 指令 都 必须 在 一 个 周期 内 执行 ,那么 所 有 
指令 的 长 度 就 必须 相同 。 

第 四 条 RISC 设计 原则 是 : 只 有 几 种 简单 的 寻 址 方式 。Pep/9 有 八 种 寻 址 方式 ， 如 
图 12-8 所 示 。 在 这 八 种 方式 中 ，RISC 机 器 不 能 有 复杂 方式 : 间接 寻 址 、 栈 相对 间接 寻 址 以 
及 栈 间 接 变 址 寻 址 ， 因 为 这 些 模式 需要 多 次 内 存 读 取 。 由 硬件 Mc2 层 提供 的 操作 数 地 址 计 
算 必 须 由 软件 编译 器 提供 。 例 如 ， 如 果 一 个 HOL6 层 程 序 的 数据 结构 需要 栈 间 接 变 址 寻 址 ， 
编译 器 就 必须 在 ISA3 层 生成 代码 计算 Mem[SP+OprndSped+X]， 因 为 这 不 由 Mc2 层 的 硬件 
来 提供 。 因 此 ，RISC 机 器 的 应 用 程序 代码 量 大 于 CISC 机 器 中 相同 应 用 程序 的 代码 量 。 

第 五 条 RISC 设计 原则 是 : 所 有 的 算术 逻辑 运算 完全 在 CPU 内 发 生 。 考 虑 直接 寻 址 的 
Pep/9 ADDA 指令 ， 它 把 Mem[OprndSpec] 和 累加 器 相 加 ， 和 数 存 回 累加 器 。 加 法 运算 需要 
访问 内 存 ， 它 会 消耗 多 个 内 存 访 问 周期 。 为 了 最 大 限度 减少 内 存 访问 ，RISC 机 器 用 大 量 的 
通用 寄存 器 组 来 蓉 代 少量 的 专用 寄存 器 组 。 处 理 器 用 寄存 器 寻 址 来 执行 算术 和 逻辑 运算 。 

例如 ，Pep/9 把 


x Sy Æ ži 
翻译 为 汇编 语言 代码 
LDWA y,d 


ADDA z,d 
STWA x,d 


其 中 ,x，y，z 是 存储 在 内 存 固 定位 置 的 全 局 变量 。 上 述 三 条 汇编 语言 语句 都 需要 内 存 访问 。 
这 种 翻译 模式 使 得 Pep/9 成 为 所 谓 的 累加 器 机 器 。 在 RISC 机 器 中 ,与 之 等 价 的 代码 是 


LDW rl,y,d jLoad y into register rl 

LDW r2,z,d ;Load z into register r2 

ADD r3,xr1,r2 ;Add rl + r2 and put the sum in r3 
STW r3,x,d ¿Store register r3 into x 


其 中 , rl, r2 和 13 是 来 自 大 量 通用 寄存 器 组 的 三 个 寄存 器 。ADD 指令 使 用 寄存 器 寻 址 方式 ， 
不 需要 内 存 访问 。 这 种 翻译 模式 使 得 RISC 处 理 器 成 为 所 谓 的 装 入 /存储 机 器 。 

上 面 的 例子 看 起 来 RISC 机 器 上 的 执行 时 间 可 能 会 增加 ， 因 为 仍然 有 三 次 内 存 访问 以 及 
一 次 加 法 。 从 长 远 来 看 ， 相 对 CISC, RISC 机 器 的 内 存 访 问 是 最 小 化 的 ， 因 为 大 寄存 器 组 对 
最 近 使 用 过 的 变量 就 好 像 高 速 缓存 一 样 。 编 译 器 为 一 组 最 近 使 用 过 的 变量 维护 一 个 内 部 符号 
表 ， 变 量 第 一 次 被 访问 时 ， 编 译 器 为 它 分 配 一 个 寄存 器 。 当 函数 执行 算术 和 逻辑 运算 需要 这 
些 变量 时 ， 只 需要 使 用 寄存 器 副本 ， 不 需要 进行 内 存 访问 。 生 成 代码 只 在 必要 的 时 候 才 把 变 
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量 值 存储 到 内 存 ， 比 如 ， 执 行 return 语句 的 时 候 。 
第 六 条 RISC 设计 原则 是 : 数据 区 是 为 了 深度 流水 线 设 计 的 。 这 个 原则 不 是 RISC 处 理 


器 所 独 有 的 ，CISC 处 理 器 也 使 用 流水 线 来 缩短 周期 。 但 是 ， 简 单 的 指令 


址 方式 使 得 RISC 处 理 器 能 更 加 高 效 地 实现 深度 流水 线 。 


Intel 和 AMD 制造 的 x86 处 理 器 是 
市 场 上 使 用 最 广泛 的 CISC 处 理 咒 ， 其 


内 部 设计 的 细节 ， 包 括 Me2 层 微 代码 控 


制 单元 的 设计 是 专 有 的 ， 被 认为 是 公司 
秘密 。 这 些 公司 甚至 对 芯片 上 的 微 代码 
以 便 将 其 隐藏 起 来 。 不 过 ， 
通过 有 限 的 出 版 物 和 这 向 工程 技术 ， 


进行 了 加 密 ， 


们 还 是 了 解 了 部 分 设计 。 


现代 x86 $ E 


NRG AB: E 


该 标志 可 以 被 汇编 语言 程序 员 置 1 和 
0。 使 用 movsb 指令 时 ， 程 序 员 首先 

















助 记 符 代表 的 是 事 字 节 传送 (move string ; 
byte), 这 是 一 le oe 
ASCI 字 节 从 一 个 内 存 位 置 复制 到 另 - 


on 
ESI 源 变 址 寄存 器 和 EDI 
目的 变 址 寄存 器 ， 以 及 ECX 害 存 器 用 
FEHR. uan- DANAE, 














eh A ERA. KELNA OERE MRE A ESI, de E He 
期 的 简单 指令 直接 在 硬件 中 用 有 限 状态 入 EDI， 把 字 节 计数 值 送 入 ECX， 并 根 ， 
机 来 实现 ， 该 硬件 可 以 输出 固定 长 度 的 1 据 复制 的 方向 是 从 左 到 右 还 是 从 右 到 左 ，， 


类 RISC 操作 (ROP)。 更 复杂 的 指令 则 


把 方向 标志 置 1 或 清 0。 然 后 ， 只 需 执行 ， 


a i rp ISA3 层 的 movsb 指 令 就 可 以 利用 Mc2 
图 12-34 展示 了 AMD 芯片 实现 复杂 RE 
a 


的 movsb A ena, 


To 
|2. OR ecx, ecx. 


move bo mo a data, from source > and inc/aee ast 


图 12-34 ire yr AMD pies 
人 


FA Mb Wi 全 





“ 址 2 是 必需 的 ， 而 AMD RAW 
和 使 用 的 是 符号 名 ecxe Pep/9 fk 





Th a ees 
re A 
a aes 





ATOSI ea tte 


; 4 load direction flag to latch in functional ‘ante | 
kest. AE EX is zero 
nl WE move 4 ECX is zero 
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12.3 MIPS 机 器 


从 20 世 纪 80 年 代 以 来 ， 几乎 所 有 新 设计 的 CPU 都 是 RISC 机 器 ， 其 中 最 著名 的 
有 两 种 其 一 是 ARM 芯 片 ， 在 手机 和 平板 电脑 市 场 占据 主导 ; 其 二 是 MIPS 芯片 ， 基 
于 Stanford 设计 ， 用 在 服务 器 和 任天堂 的 游戏 控制 器 中 。MIPS 是 microprocessor without 
interlocked pipeline stages (无 联 锁 流 水 线 阶 段 微 处 理 器 ) 的 缩写 。 不 过 ， 还 有 一 种 CISC iz 
计 继 续 主导 着 台式 机 和 笔记 本 电脑 市 场 ， 那 就 是 Intel 的 x86-64 系列 处 理 器 ， 图 12-26 中 列 
出 的 最 新 芯片 系列 。 它 能 够 继续 主导 主要 是 因为 与 系列 中 以 前 的 所 有 芯片 都 兼容 。 把 应 用 程 
序 和 操作 系统 迁移 到 具有 不 同 ISA3 指令 和 寻 址 方式 的 芯片 上 代价 是 很 高 的 。 而 且 ，CISC iz 
计 者 采用 了 RISC 的 理念 ， 对 RISC 核 进行 了 一 层 抽象 ， 核 的 细节 隐藏 在 更 低 的 层次 上 ， 并 
HÆ ISA3 层 实现 了 CISC Hitt. 


12.3.1 寄存 器 组 


MIPS 机 器 是 商用 制造 的 装 和 /存储 机 器 的 经 典 例 子 ， 它 是 一 个 32 位 机 器 ，CPU 中 
有 32 个 32 位 寄存 器 。64 位 的 MIPS 也 有 32 个 寄存 器 ， 但 是 每 个 寄存 器 都 是 64 位 宽 。 图 
12-35 按 比例 画 出 了 32 位 MIPS CPU 中 的 寄存 器 和 Pep/9 中 的 寄存 器 。 





32 








a) MIPS 寄 存 器 
|<—— 16 —+>| 
X SP 
b) Pep/9 寄 存 器 
图 12-35 32 位 MIPS 和 Pep/9 CPU 寄存 器 比较 


每 个 寄存 器 都 有 一 个 特殊 的 汇编 命名 ， 以 $ 符 号 开头 。$0 是 一 个 常数 0 寄存器， 类 
似 于 图 12-2 中 的 寄存 器 22， 不 过 它 在 ISA3 层 是 可 见 的 。$v0 和 $vl 用 于 子 例 程 返回 值 ， 
$a0 ~ $a3 用 于 子 例 程 的 参数 ， 类 似 于 6.5 节 中 操作 符 malloc 的 调用 协议 。 以 St 开头 的 寄存 
器 是 临时 的 ， 在 函数 调用 之 间 不 会 保留 ， 而 以 $a 开头 的 寄存 器 会 保存 起 来 ， 在 函数 调用 之 
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间 得 以 保留 。$k 寄存 器 预 留 给 操作 系统 内 核 , Sep 是 全 局 指针 , Ssp 是 栈 指针 , Sfp 是 帧 指针 ， 
而 $ra 是 返回 地 址 。 

和 大 多 数 微 处 理 器 相 比 ，Pep/9 是 很 小 的 机 器 。 图 12-25 表明 MIPS CPU 寄存 器 的 总 位 
数 是 Pep/9 CPU 寄存 器 的 16 倍 ， 这 还 不 算 MIPS 拥 
有 的 另 一 组 浮 点 寄存 器 ， 而 Pep/9 没有 浮 点 寄存 器 。 


do { 
即使 数量 上 有 这 么 大 的 差距 ， 从 两 个 方面 来 说 MIPS Fetch the instruction at the address in PC 
if 是 比 Pepj3 更 简 i : € 有 更 少 的 FAE 方 式 以 及 oF specifier 
它 的 指令 长 度 都 是 一 样 的 ， 即 4 个 字 节 。 为 了 提高 Execute the instruction fetched 


性 能 ， 内 存 对 齐 问题 要 求 每 条 指令 的 第 一 个 字 节 |}, 
必须 存储 在 能 被 4 整除 的 地 址 处 。 图 12-36 展示 了 
MIPS 机 器 的 汉 . 诺 依 曼 周期 。 没 有 让 语句 来 确定 。 “图 12-36 MIPS 冯 . 诺 依 曼 执行 周期 的 
指令 的 大 小 。 伪 代 码 描述 

图 12-36 中 MIPS 的 冯 ， 诺 依 曼 周 期 是 一 个 无 
限 循环 ， 这 比 Pep/9 的 循环 更 实际 。 实 际 机 器 没有 STOP 指令 ， 因 为 当 一 个 应 用 程序 结束 后 
操作 系统 会 继续 执行 。 


12.3.2 JWA 


HALL Pep/9 的 八 种 寻 址 方式 ，MIPS 只 有 五 种 寻 址 方式 ， 如 图 12-37 所 示 。 五 种 寻 址 方 
式 适 用 于 三 种 指令 类 型 : I 型、R 型 和 J 型 。 图 12-38 展示 了 每 种 寻 址 方式 的 指令 格式 。 使 
用 立即 数 寻 址 、 基 址 寻 址 和 PC 相对 寻 址 的 是 I 型 指令 。 用 寄存 器 寻 址 的 是 R ES, A 
直接 寻 址 的 是 了 型 指令 。MIPS 指令 总 是 有 一 个 6 位 的 操作 码 来 指示 指令 ， 还 有 一 个 或 多 个 
操作 数 指 示 符 。 如 果 有 rs 字段 ， 它 总 是 在 位 6 ~ 10 处 ,rt 字段 总 是 在 位 11 ~ 15 处 ,rd 字 
段 总 是 在 位 16 ~ 20 处 。 本 章 指定 的 位 序 从 最 左边 的 位 ， 即 位 0 开始， 从 左 到 右 进行 编号 以 
便 与 Pep/9 表示 法 一 致 。 标 准 的 MIPS 表示 法 把 最 右边 的 位 当 作 位 0， 从 右 到 左 进行 位 编号 。 























Reglrs] SE(im) 











装 入 基 址 I 型 Reg[rt] Mem[Reg[rb] + SE(im)] 


y 












Na 


PC 相对 I 型 PC PC+4 SE(im x 4) 






图 12-37 MIPS 寻 址 方式 


因为 图 12-35a 的 寄存 器 组 中 有 32 个 寄存 器 ， 而 2 是 32， 因 此 需要 5 位 来 访问 这 些 寄 
存 器 。 标 准 MIPS 表示 法 用 标号 rs rt 和 rd 表示 指令 的 5 位 寄存 器 字段 。 图 12-37 显示 rs 总 
是 表示 源 寄 存 器 ，rd 总 是 表示 目的 寄存 嚣 ， 而 代表 目标 寄存 器 的 tt 则 既 可 以 是 源 寄存 器 也 
可 以 是 目的 寄存 器 。 图 12-37 中 的 符号 Reg 代表 的 是 寄存 器 ， 类 似 的 Mem 代表 的 是 内 存 ， 
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Reg[r] 表示 寄存 器 r 的 内 容 。 比 如 ， 知 执行 一 条 立即 数 寻 址 的 指令 ， 图 12-37 就 把 Reg[r] 显 
示 为 目的 操作 数 。 如 果 图 12-38a 中 5 位 rt 字段 的 值 位 10011 (bin)， 即 19 ( dec)， 那 么 目的 
寄存 器 $s3 将 包含 操作 的 结果 ， 因 为 $s3 就 是 图 12-35 中 的 寄存 器 19。 


32 








<< 6 —— |a 5 —>|qa— 5 —_ >| 16 一 > 
op rs rt immediate 
Opcode Source register| Dest register Immediate 
a) 立即 数 寻 址 的 型 指令 
e—a 85. —_» <5) —_ > <5 —_ M o 
op TS rt rd shamt funct 
Opcode Source register | Source register} Dest register | Shift amount Function field 
b) 寄存 器 寻 址 的 R 型 指令 
|< 6 ——» |< 5 —» |< 5 | 


op rs rt immediate 
Opcode Base register | Target register Address displacement 


c) 基 址 寻 址 的 1 型 指令 


jaim i I MH 


op Ts rt immediate 
Opcode Source register! Branch cond Branch displacement 


d) PC 相对 寻 址 的 型 指令 








| 





op target 
Opcode Target address 
e) 伪 直 接 寻 址 的 ] 型 指 今 


图 12-38 与 寻 址 方式 对 应 的 MIPS 指令 格式 


函数 SE(im) 是 立即 数 操作 数 的 符号 扩展 。 如 果 16 位 操作 数 的 符号 位 是 0， 表示 这 个 量 
是 个 正 数 ， 那 么 ，16 位 操作 数 扩展 为 32 位 就 需要 添加 16 个 前 置 0。 如 果 16 位 量 的 符号 位 
是 1， 那 么 扩展 16 位 操作 数 就 需要 添加 16 个 前 置 1。 例 如 ，16 位 量 7C9B (hex) 会 扩展 成 
32 位 量 00007C9B (hex), mi 8C9B (hex) 则 会 扩展 成 FFFF8C9B ( hex)。 符 号 扩展 不 会 改 
变 操 作 数 的 十 进 制 值 。 

图 12-38a 显示 了 立即 数 寻 址 的 指令 格式 。 立 即 数 操作 数 不 会 是 32 位 ， 因 为 它 必然 是 
32 位 指令 的 一 部 分 。 它 会 符号 扩展 到 32 位， 并 与 一 个 源 操作 数 Reg[rs] 组 合 ， 结 果 放 入 
Reg[rt]。 使 用 立即 数 寻 址 时 ，rt 是 目的 寄存 器 。 

图 12-38b 显示 了 寄存 器 寻 址 的 指令 格式 。 所 有 的 算术 和 逻辑 运算 都 使 用 带 有 源 寄 存 器 
和 目的 寄存 器 的 寄存 器 寻 址 。 比 如 ， 一 条 指令 可 以 把 两 个 不 同 的 变量 相 加 ， 并 将 结果 放 人 
第 三 个 变量 。 功 能 字段 实际 上 是 扩展 操作 码 ， 如 果 操 作 码 字段 是 000000 (bin)， 指 令 就 使 
用 寄存 器 寻 址 ， 而 功能 字段 决定 运算 。 例 如 ， 如 果 功 能 字段 是 100000， 那 么 运算 就 是 加 法 ; 
如 果 该 字段 是 100010， 那 么 运算 就 是 减法 。Pep/9 的 移 位 指令 只 能 向 左 或 向 右 移动 一 位 ， 
MIPS 处 理 器 则 可 以 在 一 个 周期 内 将 寄存 器 移 位 多 次 。 移 位 量 字段 指明 有 多 少 位 需要 移动 。 
使 用 寄存 器 寻 址 时 ,rt 是 源 寄 存 器 。 
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图 12-38 显示 了 基 址 寻 址 的 指令 格式 。 在 所 有 的 寻 址 方式 中 ， 这 种 寻 址 方式 是 唯一 会 访 
间 主 存 的 。rs 字段 指定 基 址 寄存 器 ， 在 图 12-37 中 写作 tb。 指 令 把 符号 扩展 的 立即 数字 段 与 
基 址 寄存 器 内 容 相 加 计算 出 内 存 地 址 。 对 装 和 人 指令 而 言 ， 内 存 是 源 ， 寄 存 器 rt 是 目的 ; 对 存 
储 指令 而 言 ， 寄 存 器 rt 是 源 ， 内 存 是 目的 。 

图 12-38d 显示 了 PC 相对 寻 址 的 指令 格式 。 条 件 分 支 指令 使 用 这 种 寻 址 方式 来 改变 程序 
计数 器 。 如 果 分 支 条 件 满 足 ， 就 用 如 下 规则 修改 程序 计数 器 


PC & (PC + 4) + SE(im x 4) 


MIPS 指令 为 32 位 长 ， 因 此 当 它 们 存储 在 主 存 中 时 要 对 齐 四 字 节 边界 。 由 于 永远 不 会 访问 
未 对 齐 的 指令 ， 所 以 ， 立 即 数 操作 数 乘 以 4， 即 相当 于 左 移 2 位 。 移 位 的 操作 数 进行 符号 扩 
展 ， 并 加 上 程序 计数 器 中 已 增加 过 的 值 。 加 到 PC 上 的 数值 是 一 个 18 位 的 有 符号 数 ， 即 16 
位 立即 数 操作 数 再 左 移 2 位。 这 个 18 位 有 符号 数 的 范围 时 -2 ”到 (2"-1)。 因 此 ,使 用 
PC 相对 寻 址 可 以 分 支 到 距离 当前 PC 前 后 128KiB 的 范围 内 。 想 要 分 支 范围 超越 这 个 限制 就 
需要 使 用 其 他 寻 址 方式 ， 大 多 数 条 件 分 支 都 在 这 个 限制 范围 内 。 例 如 ， 符 号 endFor 和 与 其 
对 应 的 for 符号 就 相距 不 远 ， 因 为 循环 体 通常 都 小 于 128KiB。 

图 12-38d 显示 rt 字段 指定 分 支 条 件 。PC 相对 寻 址 中 的 rt 字段 是 扩展 操作 码 的 另 一 个 
例子 。 如 果 6 位 操作 码 字段 的 值 为 000001， 那 么 指令 就 是 条 件 分 支 ， 而 rt 字段 就 指明 条 件 。 
举 个 例子 ， 假 如 rt 字段 是 00000， 则 条 件 就 是 rs 小 于 零 ; 但 是 ， 如 果 rt 字段 是 00001， 则 条 
件 就 是 rs 大 于 等 于 零 。 有 些 条 件 分 支 指令 的 6 位 操作 码 字 段 不 是 000001。 

所 有 处 理 器 都 有 使 用 某 种 形式 的 PC 相对 寻 址 的 分 支 指令 。 第 6 章 给 出 了 x86 架构 下 
PC 相对 寻 址 的 例子 。Pep/9 不 需要 PC 相对 寻 址 ， 因 为 所 有 应 用 程序 装 入 内 存 时 都 是 从 地 址 
0000 开始 的 ， 汇 编 器 能 知道 每 个 全 局 变量 和 程序 指令 的 绝对 内 存 地 址 ， 并 相应 地 计算 每 个 
符号 的 值 。 在 Pep/9 中 ， 到 endFor 的 分 支 使 用 该 符号 作为 指令 的 绝对 地 址 。 

在 实际 中 ， 操 作 系 统 要 同时 管理 多 个 进程 ， 这 些 进程 的 代码 分 散在 整个 内 存 映射 的 各 个 
位 置 。 汇 编 器 很 难 在 翻译 的 时 候 知 道内 存 中 哪里 的 程序 要 被 装 和 信和 执行 ， 因此， 直接 寻 址 很 
少 被 使 用 。 当 MIPS 汇编 器 遇见 到 endFor 的 分 支 时 ， 它 会 计算 从 定义 该 符号 到 使 用 该 符号 
之 间 间 隔 的 字 节 数 ， 并 由 此 生成 PC 相对 分 支 中 的 立即 数值 。 不 论 程 序 被 装 入 到 内 存 的 哪个 
位 置 ， 符 号 定义 与 使 用 之 间 的 字 节 数 不 会 发 生变 化 ， 因 此 ， 代 码 可 以 正确 地 执行 。 同 样 的 概 
念 也 用 于 Pep/9 的 栈 相 对 寻 址 ， 局 部 变量 的 内 存 位 置 由 该 变量 对 栈 指针 的 偏 移 量 来 指定 。 在 
PC 相对 寻 址 中 ， 偏 移 量 是 相对 于 程序 计数 器 的 ， 而 不 是 相对 于 栈 指针 的 。 

图 12-38e 显示 的 指令 格式 是 使 用 伪 直 接 寻 址 的 无 条 件 分 支 指令 j, j 代 表 的 是 跳 转 
(jump)。 程 序 计数 器 的 修改 规则 如 下 : 


PC & (PC + 4) (0 .. 3) : (ta x 4) 


数值 ta 是 26 位 的 目标 地 址 ， 左 移 2 位 后 长 度 变 为 28 位 。 规 则 中 的 冒号 是 连接 运算 符 。 增 
加 后 的 程序 计数 器 值 的 最 低 4 位 连接 上 由 目标 地 址 移 位 后 形成 的 28 位 ， 就 产生 了 PC 的 32 
位 地 址 。 

使 用 伪 直 接 寻 址 方式 会 被 限制 在 由 程序 计数 器 低 4 位 指定 的 十 六 分 之 一 的 内 存 映 射 中 。 
PC 相对 寻 址 和 伪 直 接 寻 址 都 不 允许 无 限制 地 访问 整个 4GiB 地 址 空间 。MIPS 提供 用 基 址 寻 
址 的 寄存 器 跳 转 指令 jr 来 访问 整个 地 址 空间 的 任意 地 址 。 程 序 计数 器 的 修改 规则 如 下 


PC & Reg[rb] 
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H, rb 是 图 12-380 所 示 rs 字段 中 的 基 址 寄存 器 。 这 条 指令 要 求 程 序 员 在 执行 无 条 件 分 支 
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做 代码 (A26) 


之 前 计算 地 址 并 将 其 送 入 基 址 寄存 器 。 
12.3.3 HFE 


图 12-39 是 一 些 MIPS 指令 的 总 结 。 第 一 列 是 MIPS 汇编 语言 指令 的 助 记 符 。 标 记 为 
sssss 和 ttttt 的 操作 数 指示 符 是 5 位 的 源 寄 存 器 字段 ， 标 记 为 ddddd 的 为 5 位 目标 寄存 器 字 
段 ， 而 标记 为 bbbbb 的 是 5 位 基 址 寄存 器 字段 。 内 容 为 i 字符 的 字段 是 立即 数 操作 数 指示 
符 ， 对 加 法 ， 立 即 数 做 符号 扩展 ， 对 AND 和 OR， 立即 数 做 零 扩 展 。 内 容 为 a 字符 的 字段 
是 地 址 操作 数 指 示 符 ， 在 地 址 计算 中 作为 符号 扩展 偏 移 量 。 标 记 为 hhhhh 的 操作 数 指示 符 是 


移 位 指令 的 5 位 位 移 量 。 






访问 。 


加 法 


立即 数 帮 法 


减法 
按 位 AND 
按 位 立即 数 AND 


按 位 OR 


按 位 立即 数 OR 
逻辑 左 移 
算术 右 移 


”逻辑 右 移 


字 节 装 人 
字 装 内 


立即 数 高 位 装 和 人 


字 节 存储 

字 存 储 
相等 则 分 支 

大 于 等 于 0 则 分 支 
大 于 0 则 分 支 

小 于 等 于 0 则 分 支 
小 于 0 则 分 支 

不 相等 则 分 支 
跳 转 

寄存 器 跳 转 





0000 
0010 
0000 
0000 
0011 
0000 
0011 


0000 


0000 


0000 | 


1000 
1000 
0011 
1010 
1010 
0001 
0000 
0001 
0001 
0000 
0001 
0000 
0000 


图 12-39 MIPS 指令 集中 的 一 些 指令 


下 面 的 一 些 例子 是 C 语言 代码 片段 及 翻译 后 的 MIPS 汇编 语言 。MIPS 处 理 带 用 包含 32 
个 寄存 器 的 寄存 器 组 来 高 速 缓存 变量 。 当 第 一 次 访问 变量 时 ， 编 译 器 会 把 一 个 寄存 右 与 这 个 
值 关 联 起 来 ， 之 后 的 访问 会 使 用 寄存 器 中 的 变量 副本 而 不 是 再 次 访问 内 存 。 在 Pep/9 中 ， 全 
局 变量 存储 在 内 存 ， 有 固定 的 绝对 地 址 ; 在 MIPS 中 ,全 局 变量 可 以 相对 于 全 局 指针 Sgp 来 





00ss 


00ss 
00ss 


eal 


00ss 


00ss 


Olss 
0000 
0000 
0000 
00bb 
11bb 
1100 
00bb 
11bb 
00ss 
Olss 
liss 
10ss 
Olss 
Olss 


l0aa 


00bb 


ssst 


‘sssd 


ssst 


“ssst 


sssd 
ssst 
sssd 
000t 
000t 
000t 
bbbd 
bbbd 
000d 
bbbt 
bbbt 


“ssst 


sss0 
sss0 
sss0 
sss0 
ssst 
aaaa 


bbb0 





tEtE 
dddd 


七 七 七 七 
tttt 
dddd 


tttt 


dddd 
Tttt 
tttt 
tett 
dddd 
dddd 
dddd 


tttt a ae 


tttt 
tttt 
0001 
0000 
0000 
0000 
tttt 
aaaa 


0000 





d000 


Aili 
d000 


a000 


iii 
d000 
iiii 
dhhh 
dhhh 


dhhh 


aaaa 
aaaa 


iiii 


- aaaa 


aaaa 


aaaa 


aaaa 


aaaa 


aaaa 


 aaaa 


aaaa 
aaaa 
0000 


0010 


iili 
0010 


0010 


iiii 
0010 
iiti 
hhoo 
hhoo 
hhoo 
aaaa 
aaaa 
iiii 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
0000 


0000 


dili 
0010 
0100 
jiii 
0101 
iiii 
0000 
0011 
0010 
aaaa 
aaaa 
ELTI 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 
aaaa 


1000 
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图 5-27 声明 了 三 个 全 局 变量 examl exam2 和 score， 以 及 一 个 等 于 10 的 党 
量 bonus。C 语言 编译 器 把 三 个 全 局 变量 放 在 距离 Sop 偏 移 量 为 0、4、8 的 位 置 上 ， 并 把 它 
们 与 寄存 器 组 中 的 寄存 器 $s1 、$s2 和 $s3 关联 起 来 。C 语句 749 


score = (examl + exam2) / 2 + bonus; 750 
翻译 的 MIPS 汇编 语言 


lw $s1,0($gp) # Load examl into register $sl 

lw $s2,4($gp) # Load exam2 into register $s2 

add $s3,$sl1,$s2 # Register $s3 gets examl + exam2 
sra $s3,$s3,1 # Shift right register $s3 one bit 
addi $s3,$s3,10 # Register $s3 gets $s3 + 10 

sw $s3,8($gp) # score gets $s3 


注释 以 符号 “# ”开始 。 在 MIPS 汇编 语言 中 ， 助 记 符 后 面 的 第 一 个 参数 通常 是 目的 操 
作 数 。 比 如 , 一 条 lw 指令 中 ，$sl 是 目的 寄存 器 ; 在 add 指令 中 ，$s3 是 目的 寄存 器 。sw 指 
令 是 这 个 通用 规则 的 一 个 例外 。Iw 指令 的 RTL 描述 为 

Reg[rt] — Mem[Reg[rb] + SE(im)] 
sw 指令 的 描述 为 

Mem[Reg[rb] + SE(im)] + Reg[rt] 


在 这 两 条 指令 中 ， 基 址 寄存 器 Sep 在 括号 内 ， 前 面 是 以 十 进 制 表示 的 立即 数 操作 数 。 
add 指令 的 RTL 描述 是 


Reglrd] <— Reg[rs] + Reg[rt] 


其 中 ， 目 的 寄存 器 rd 是 $s3 ， 源 寄存 器 rs 是 $s1， 目 标 寄存 器 rt 是 $s2。 助 记 符 addi 代表 的 
是 add immediate (立即 数 加 法 )， 显 然 要 使 用 立即 数 寻 址 。 上 述 指令 翻译 为 如 下 的 机 器 语言 

100011 11100 10001 0000000000000000 

100011 11100 10010 0000000000000100 

000000 10001 10010 10011 00000100000 

000000 00000 10011 10011 00001 000011 

001000 10011 10011 0000000000001010 

101011 11100 10011 0000000000001000 

对 基 址 寻 址 ， 图 12-38c 显示 基 址 寄存 器 字段 在 操作 码 字 段 旁边 。 上 面 的 lw 和 sw 指令 
把 Sgp 作为 基 址 寄存 器 。 图 12-35 中 $gp 是 寄存 器 28 (dec) =11100 (bin)， 在 上 述 机 器 码 中 
它 是 操作 码 字 段 后 面 的 寄存 器 字段 。 对 使 用 寄存 器 寻 址 的 add 指令 来 说 ， 机 器 码 中 的 字段 顺 
序 是 rs、rt 和 rd， 与 图 12-38b 一 致 ， 而 在 汇编 代码 中 的 顺序 是 rd、rs 和 rt， 目 的 字段 排 在 ”[751 
第 一 个 。 在 图 12-35 中 ， 可 以 找到 下 列 全 局 变量 在 前 面 机 器 码 中 的 二 进 制 字段 : 

e $sl 是 寄存 器 17 (dec) =10001 (bin) 

o $s2 是 寄存 器 18 (dec) =10010 (bin) 

e $s3 是 寄存 器 19 (dec) =10011 (bin) 

把 整个 数组 都 存储 在 寄存 器 组 中 是 不 可 能 的 ， 因 为 大 多 数 数组 的 元 素数 量 远 远 超 过 了 可 
用 寄存 器 的 数量 。 在 处 理 数 组 的 时 候 ，C 语言 编译 器 把 数组 第 一 个 元 素 的 地 址 与 一 个 寄存 器 
关联 起 来 ， 然 后 使 用 基 址 寻 址 访问 该 数组 中 的 元 素 。Pep/9 用 变 址 寻 址 来 访问 数组 元 素 ， 操 
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作 数 用 下 面 的 式 子 来 指定 
Oprnd = Mem[OprndSpec + X] 


Pep/9 与 MIPS 之 间 一 个 明显 的 区 别 就 是 用 寄存 器 来 访问 数组 元 素 。 在 Pep/9 中 ， 寄 存 
器 X 包 含 的 是 变 址 值 ; 在 MIPS HLAP, 2 ff at rb 包含 的 是 数组 第 一 个 元 素 的 地 址 ， 换 名 
话说 ， 数 组 的 基 址 。 这 就 是 为 什么 寄存 髓 rb 被 称 为 基 址 寄存 器 ， 这 种 寻 址 方式 被 称 为 基 址 
Fuk, 

OERE) 假设 C 编译 器 把 Ss1 和 数组 a、$s2 和 变量 g、$s3 和 数组 b 关联 起 来 ， 把 下 面 
的 语句 

a[l2] = g + b[3]; 
翻译 成 MIPS 汇编 语言 

lw $t0,12($s3) # Register $t0 gets b[3] 


add $t0,$s2,$t0 # Register $t0 gets g + b[3] 
sw $t0,8($s1) # a[2] gets g + b[3] 


装 和 指令 地 址 字段 为 12， 因 为 它 要 访问 b[3]， 每 个 字 是 4 字 节 ， 所 以 3 x 4=12。 类 似 地 ， 存 
储 指令 的 地 址 字段 是 8， 因 为 索引 值 在 af2]。 这 些 指令 的 机 器 语言 翻译 是 

100011 10011 01000 0000000000001100 

000000 10010 01000 01000 00000 100000 

101011 10001 01000 0000000000001000 

图 12-35 表明 $t0 是 寄存 器 8(dec)=01000(bin), $s3 是 寄存 器 19(dec)=10011(bin), $s2 
是 寄存 器 18(dec)=10010(bin)， 而 $s1 是 寄存 器 17(dec)=10001(bin)。 m 

如 果 想 要 访问 一 个 下 标 为 变量 的 数组 元 素 ， 情 况 就 更 复杂 一 些 。 与 Pep/9 不 同 ，MIPS 
没有 变 址 寄存 器 。 所 以 ， 编 译 器 必须 生成 代码 ， 把 索引 值 加 到 数组 第 一 个 元 素 的 地 址 ， 获 
得 想 要 引用 元 素 的 地 址 。 在 Pep/9 中 ,这 个 加 法 运算 是 在 Mec2 层 用 变 址 寻 址 自动 完成 
的 。 但 是 装 入 /存储 机 器 的 设计 哲学 是 拥有 较 少 的 寻 址 方式 ， 付 出 的 代价 是 程序 需要 更 多 
语句 。 

在 Pep/9 中 ， 一 个 字 有 2 个 字 节 ， 所 以 索引 必须 左 移 一 次 ， 相 当 于 乘 以 2。 在 MIPS F, 
一 个 字 是 4 个 字 节 ， 所 以 索引 要 左 移 两 次 ， 相 当 于 乘 以 4。MIPS 指令 sll 用 于 逻辑 左 移 ， 用 
图 12-38b 中 的 shamt 字段 指定 位 移 的 量 。 

CEE 把 $s0 的 内 容 左 移 7 位 并 把 结果 放 到 $t2 中 的 MIPS 汇编 语言 语句 是 

sll $t2,$s0,7 
机 器 语言 的 翻译 是 

000000 00000 10000 01010 00111 000000 

第 一 个 字段 是 操作 码 ; 这 条 指令 没有 使 用 第 二 个 字段 ， 因 此 都 被 设置 为 0; 第 三 个 
字段 是 rt 字段 ， 表 明 $s0， 寄 存 器 16(dec)=10000 ; 第 四 个 是 rd 字段 ， 表 明 $2, AE 
10(dec)=01010(bin) ; 第 五 个 是 shamt 字段 ， 表 明 移 位 的 数量 ; 最 后 一 个 是 funct 字段 ， 和 操 
作 码 一 起 表明 是 sll 指令 。 m 

假设 C 编译 器 把 $s0 和 变量 i、$sl 和 数组 a 以 及 $s2 和 变量 g 关联 起 来 ， 把 
下 面 的 语句 
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g = a[i]; 
翻译 成 MIPS 汇编 语言 如 下 : 
sll $t0,$s0,2 # $t0 gets $s0 times 4 
add $t0,$s1,$tO # $t0O gets the address of a[i] 
lw $s2,0($t0) # $s2 gets a[i] 
注意 装 人 指令 的 地 址 字段 是 0。 
和 Pep/9 一 样 ，MIPS 机 器 的 寄存 器 组 中 有 一 个 栈 寄 存 器 $sp。 和 Pep/9 不 同 ，MIPS 没 
有 特殊 的 ADDSP 指令 ， 因 为 addi 指令 可 以 访问 寄存 器 组 32 个 寄存 器 中 的 任意 一 个 ， 包 
fi $sp。 要 在 运行 时 栈 上 分 配 存储 空间 ， 执 行 带 负 立即 数 的 addi， 并 把 $sp 作为 源 和 目的 寄 
FE RE o 
在 运行 时 栈 上 分 配 4 字 节 存储 ， 要 执行 
addi $sp,$sp,-4 # $sp <- $sp - 4 
这 里 的 -4 不 是 地 址 ， 而 是 立即 数 操作 数 。 机 器 语言 翻译 为 
001000 11101 11101 1111111111111100 


这 里 Ssp 是 寄存 器 29. a 

你 可 能 已 经 注意 到 addi 指令 有 一 个 限制 。 常 数字 段 只 有 16 位 宽 ， 而 MIPS Æ 32 位 机 
器 ， 使 用 立即 数 寻 址 应 该 能 加 一 个 32 位 的 常数 。 这 里 是 装 人 /存储 体系 结构 哲学 的 又 一 个 
示例 ， 其 主要 目标 就 是 寻 址 方式 较 少 的 简单 指令 。Pep/9 设计 允许 指令 宽度 不 同 ， 也 就 是 一 
元 指令 和 非 一 元 指令 宽度 可 以 不 同 。 图 12-4 展示 了 这 样 的 设计 决定 怎样 使 得 冯 : 诺 依 曼 周 
期 的 取 指 部 分 更 复杂 : 硬件 必须 取出 指令 指示 符 ， 对 它 译 码 以 决定 是 否 需要 取 操 作 数 指示 
符 。 这 种 复杂 化 是 与 装 和 /存储 哲学 相 违背 的 ， 后 者 要 求 指 令 简单 ， 能 够 很 快 地 译 码 出 来 。 
这 样 的 简化 目标 要 求 所 有 的 指令 长 度 相同 。 

但 是 ， 如 果 所 有 的 指令 都 是 32 位 宽 ， 那么 一 条 指令 又 怎么 可 能 包含 一 个 32 位 的 立即 
数 常 数 呢 ”那样 指令 格式 中 就 没有 操作 码 的 地 方 了 。 这 里 利用 了 降低 图 12-33 中 的 第 二 个 因 
素 ， 而 代价 是 增加 第 一 个 因素 。 解 决 32 位 立即 数 常数 的 方法 是 要 求 执行 两 条 指令 。 为 了 做 
到 这 点 ，MIPS 提供 了 lui 指令 ， 意 思 是 装 人 立即 数 高 位 ， 它 把 一 个 寄存 器 的 高 16 位 设置 为 
它 的 立即 数 操作 数 ， 并 且 把 低位 设置 为 全 0。 第 二 条 指令 会 设置 低 16 位 ， 通 常 是 使 用 ok 立 
即 数 指 令 ori。 

假设 编译 器 把 寄存 器 $s2 与 变量 g 关联 起 来 ， 把 C 语句 

g = 491521; 
翻译 成 MIPS 汇编 语言 


lui $s2,0x0007 
ori $s2,$s2,0x8001 


十 进 制 数 491 521 的 二 进 制 需要 不 止 16 位 ，491 521(dec) = 0007 8001 (hex). = 


12.3.4 MIPS 的 计算 机 组 成 


图 12-40 展示 的 是 MIPS CPU 的 数据 区 ， 标 识 为 “寄存 器 组 ”的 方块 是 图 12-35a 中 的 
双 端 口 32 位 寄存 器 组 。 数 据 区 的 基本 组 成 结构 和 图 12-2 的 Pep/9 的 数据 部 分 一 致 ，ABus 
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All BBus 送 到 主 ALU, ALU 的 输出 通过 CBus 最 终 到 达 CPU 寄存 器 组 。 组 成 中 最 大 的 不 同 
是 路 径 中 的 Ll 指令 和 数据 高 速 缓存 。 因 为 大 多 数 高 速 缓存 的 命中 率 都 在 90% 之 上 ， 所 以 
我 们 可 以 假设 内 存 读 和 写 以 CPU 全 速度 在 进行 ， 没 有 MemRead 和 MemWrite 延迟 ， 除 了 
偶尔 发 生 缓 存 不 命中 的 时 候 。ABus、BBus、CBus、 进 出 ALU 的 总 线 、L1 数据 高 速 缓存 、 
JMux、PCMux 以 及 CMux 复 用 器 都 是 32 位 的 。 


JMux 






L1 instruction cache 


Address 
Instruction 







ID 


Ex 
执行 /计算 地 址 


L1 data cache 
Mem 
内 存 访问 


图 12-40 MIPS 数据 区 。 时 序 电路 用 阴影 表示 


和 Pep/9 不 同 ， 程 序 计数 器 不 是 寄存 器 组 中 的 通用 寄存 器 之 一 ， 相 反 ， 它 实际 上 是 指 
向 L1 指令 高 速 缓存 的 内 存 地 址 寄存 器 ， 除 了 程序 计数 器 自身 外 没有 单独 的 MAR。 类 似 的 ， 
ALU 的 输出 实际 上 是 指向 L1 数据 高 速 缓存 的 内 存 地 址 寄存 器 ， 也 不 存在 单独 的 MDR， 相 
反 ，ABus 实际 上 是 指向 L1 数据 高 速 缓存 的 内 存 数 据 寄 存 器 。 

CPU 不 会 写 指令 高 速 缓存 ， 只 会 请 求 从 PC 指定 的 地 址 读 。 高 速 缓存 子 系统 在 命中 时 
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会 立即 从 高 速 缓 存 中 送出 指令 ， 不 命中 时 会 延迟 CPU, RAM L2 高 速 缓存 读 到 指令 ， 写 人 
Ll 高 速 缓存 ， 并 通知 CPU 可 以 继续 了 。 因 为 CPU 决 不 会 写 指令 高 速 缓存 ， 所 以 CPU 把 高 
速 缓存 当 作 组 合 电路 ， 这 是 图 12-40 中 指令 高 速 缓存 没有 画 阴 影 的 原因 。 

RISC 机 器 的 主要 设计 目标 是 每 条 ISA3 层 指令 都 在 一 个 汉 ' 诺 依 曼 周 期 内 执行 ， 包 括 
周期 的 取 指 和 增加 部 分 。 程 序 计数 器 下 一 个 值 的 计算 必须 与 周期 执行 部 分 的 计算 并 发 进行 。 
数据 区 包含 了 一 组 专用 组 合 电 路 ， 


用 于 与 ALU 并 发 运行 的 程序 计数 

器 。ASL2 单元 的 输出 是 算术 左 移 2 
位 ; 符号 扩展 (Sign extend) 单元 根 E. 

据 16 位 输入 得 到 符号 扩展 的 32 位 
输出 。Plus4 单元 固化 为 把 4 加 到 一 LILinstmetion cache | 


个 32 位 数 上 ， 其 下 边 和 右边 的 输出 
是 32 位 的 和 ， 但 其 左边 的 输出 是 和 


Instruction 
的 最 高 4 位 。 由 于 所 有 的 指令 都 正 
好 是 4 个 字 节 ， 因 此 ， 汉 ' WRS os 
周期 的 增加 部 分 比 Pep/9 要 简单 一 





些 ， 可 以 用 这 些 专用 硬件 单元 来 实 c A B 

周期 。 CBus ABus BBus 
图 12-40 中 标记 为 译 码 指令 的 

方块 是 一 个 电路 ， 其 32 位 输入 是 当 

前 执行 指令 的 所 有 位 。MIPS 没有 


Mc2 层 来 发 出 一 系列 的 控制 信号 ， \ 过 A 


译 码 单元 对 应 于 CISC 机 器 中 的 控 
制 部 分 ， 并 输出 单 周 期 控制 信号 来 ed 


实现 指令 。 其 下 边 的 输出 是 三 个 5 POET eae os 
位 字段 A、B 和 C， 它 们 进入 寄存 

器 组 ， 对 应 于 图 12-2 所 示 的 Pep/9 

寄存 器 组 中 的 A、B、C 控制 信号 。 

图 12-41 隐藏 了 图 12-40 中 的 专用 图 12-41 MIPS 数据 区 中 来 自 译 码 单元 的 控制 信号 


硬件 单元 ， 显 示 了 译 码 单元 的 其 他 
控制 输出 。 除 了 A、B、C 输出 之 外 ,还 有 如 下 8 个 控制 信和 号: 

© JMux 控制 : 如果 为 0， 选择 左 输入 ;如果 为 1， 选择 PCMux。 
PCMux 控制 : 如 果 为 0， 选择 Plus4; 如 果 为 1， 选择 Adder. 
AMux 控制 : 如 果 为 0， 选择 ABus; 如 果 为 1， 选择 符号 扩展 。 
CMux 控制 : 如 果 为 0， 选择 数据 输出 ; 如 果 为 1, 选择 ALU。 
ALU 控制 : 多 线 功 能 选择 。 
PCCk: 程序 计数 器 的 时 钟 脉冲 。 
LoadCk: 写 寄 存 器 组 的 时 钟 脉 冲 。 
DCCk: 写 L1 数据 高 速 缓存 的 时 钟 脉冲 。 
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为 了 一 致 性 ， 多 路 复 用 器 控制 信号 遵循 了 Pep/9 的 惯例 。 具 体 说 来 ，0 控制 信号 选择 左 
输入 ，! 控制 信号 选择 右 输入 。 实 际 的 MIPS 硬件 与 这 个 惯例 不 同 ，MIPS 硬件 文档 也 与 硬 
件 单元 的 命名 约定 不 同 ， 本 文 使 用 该 命名 约定 以 便 与 Pep/9 系统 保持 一 致 。 

每 个 周期 PC 都 会 收 到 时 钟 信号 并 驱动 主 循环 。 寄 存 器 组 和 数据 高 速 缓存 并 不 总 是 接受 
时 钟 ， 这 取决 于 在 执行 的 指令 。 下 面 的 例子 给 出 了 实现 某 些 ISA3 层 MIPS 指令 的 译 码 单元 
控制 信号。 

跳 转 指令 使 用 伪 直 接 寻 址 。 图 12-40 中 IF 部 分 的 ASL 方 框 把 地 址 左 移 两 位 ， 
再 把 结果 与 增加 后 的 PC 值 的 前 4 位 (高 4 位 ) 连接 。 这 是 使 用 专用 硬件 单元 实现 图 12-37 
所 示 的 伪 直 接 寻 址 方式 。 跳 转 指令 需要 如 下 控制 信号 


1. JMux=0; PCCk 


在 周期 开始 执行 前 ，PC 是 跳 转 指令 的 地 址 ，26 位 地 址 字段 送 到 ASL2 的 输入 ， 增 加 过 
的 PC 的 前 4 位 和 ASL2 的 输出 连接 ， 送 到 JMux，JMnux 的 输出 送 到 PC。 时 钟 脉 冲 到 达 时 
会 更 新 PC。 a 

与 Pep/9 不 同 ，MIPS 处 理 器 的 条 件 分 支 指令 没有 NZVC 状态 位 ， 相 反 ， 比 较 总 是 在 寄 
存 器 组 中 的 两 个 琳 存 器 之 间 进 行 ， 其 中 的 一 个 可 能 是 $zero 寄存 器 。 要 测试 算术 运算 指令 的 
溢出 ， 程 序 使 用 的 指令 就 要 能 在 汶 出 时 产生 一 个 陷阱 ; 否则， 就 使 用 无 符号 指令 ， 这 种 指令 
在 溢出 时 不 产生 陷阱 。 比 如 ，add 指令 在 溢出 时 会 触发 一 个 系统 陷阱 ， 而 addu 指令 ， 即 无 
实现 同样 的 操作 ,但 在 溢出 时 不 产生 陷阱 。 

条 件 分 支 指令 根据 条 件 以 两 种 方式 中 的 一 种 来 改变 程序 计数 器 的 值 。 译 码 单 
ened, 根据 测试 的 结果 输出 不 同 的 控制 信号 。 如 果 不 进行 分 支 ， 其 输出 为 : 


1. PCMux=0, JMux=1; PCCk 


在 周期 开始 执行 前 ，PC 是 条 件 分 支 指令 的 地 址 ,来 自 Plus4 的 已 增加 过 的 值 送 到 

PCMux， 通 过 JMux 后 ， 随 时 钟 进入 PC。 如果 进行 分 支 ， 其 输出 为 : 
1. PCMux=1, JMux=1; PCCk 

在 周期 开始 执行 前 ，PC 是 条 件 分 支 指令 的 地 址 ，16 位 地 址 字段 送 入 Ex 部 分 的 ASL2 
的 输入 ，ASL2 输出 和 增加 过 的 PC 送 到 Ex 部 分 的 加 法 器 ， 加 法 器 的 输出 送 到 PCMux, 
PCMux 的 输出 送 到 JMux, ffi] IMux 的 输出 送 到 PC。 时 钟 脉冲 到 达 时 会 更 新 PC. 

数据 区 中 组 成 部 分 的 组 织 方式 有 助 于 存储 指令 。ABus 提供 了 一 条 路 径 ， 从 寄存 器 组 直 
ER L 数据 高 速 缓 存 的 数据 输入 。 此 外 ， 主 ALU 的 输出 连接 数据 高 速 缓存 的 地 址 线 。 因 
此 ， 存 储 指令 的 地 址 计算 的 加 法 是 由 主 ALU 而 不 是 专用 硬件 单元 完成 的 。PC 更 新 和 数据 写 
回 数据 高 速 缓存 同时 进行 。 

字 存 储 指令 sw 的 RTL 描述 为 


Mem[Reg[rb] + SE(im)] + Reg[rt] 


因为 这 条 指令 要 更 新 PC 并 写 内 存 ， 所 以 这 个 周期 同时 需要 时 钟 脉 冲 PCCk 和 DCCk。 
控制 信号 是 


1. PCMux=0, JMux=1, A=rt, AMux=1, B=rb, ALU=A plus B; 
PCCk, DCCk 


PCMux=0 和 JMux=1 信号 只 把 增加 过 的 PC 送 到 PC. A=rt 信号 把 rt 源 寄 存 器 的 内 容 送 
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到 ABus， 作 为 要 送 到 高 速 缓存 的 数据 。AMux=1 信号 选择 把 指令 的 地 址 字段 作为 ALU 的 左 
输入 ，B =rb 信号 把 基 址 寄存 器 送 到 BBus， 作 为 ALU 的 右 输入 。 选 择 加 法 功能 ， 地 址 计算 
的 结果 送 到 数据 高 速 缓存 的 地 址 线 。 

寄存 器 指令 用 主 ALU 完成 处 理 ， 但 是 不 写 内 存 。 因 此 ，ALU 的 输出 有 一 条 通过 CMux 
到 寄存 器 组 的 路 径 。 和 存储 指令 一 样 ，PC 和 寄存 器 组 的 更 新 是 同时 发 生 的 。 

加 法 指令 add 的 RTL 描述 为 


Reg[rd] < Reg[rs] + Reg[rt] 


因为 它 要 更 新 PC 和 写 寄存 器 组 ， 所 以 这 个 周期 同时 需要 时 钟 脉 冲 PCCk 和 LoadCk。 
控制 信号 是 

1. PCMux=0, JMux=1, A=rs, AMux=0, B=rt, ALU=A plus B, 

CMux=1, C=rd; PCCk, LoadCk 

PCMux=0 和 JMux=1 信号 把 增加 过 的 PC KF) PC. A=rs 信号 把 rs 源 寄 存 器 的 内 容 放 
到 ABus, AMux=0 信和 号 会 把 它 当 作 数 据 通过 AMux 送 到 高 速 缓存 。B=rt 信号 把 基 址 寄存 器 
送 到 BBus， 作 为 ALU 的 右 输 入 。 选 择 加 法 功能 ， 用 CMux=1 信号 把 结果 通过 CMux 送 到 
CBus。 信 号 C=rd 对 寄存 器 组 寻 址 ， 地 址 为 目标 寄存 器 rdo m 

装 入 指令 的 控制 信号 作为 章 末 练习 。 


12.3.5 ”流水线 


PC 在 周期 开始 时 变化 ， 数 据 必须 按照 下 列 顺序 通过 组 合 电 路 传播 : 

o IF: 指令 高 速 缓存 ，Plus4 加 法 器 ， 移 位 器 和 复 用 器 。 

© ID: 译 码 指令 方 框 ， 寄 存 器 组 ， 符 号 扩展 方 框 。 

e Ex: AMux, ASL2 itik, ALU, IMiR 

© Mem: 数据 高 速 缓存 。 

e WB: CMux， 寄 存 器 组 的 地 址 译 码 器 。 

CPU 设计 者 必须 把 时 钟 周期 设置 得 足够 长 ， 使 得 数据 送 到 时 序 电 路 (PC、 寄 存 器 组 和 
数据 高 速 缓存 )， 然 后 时 钟 会 把 数据 写 入 时 序 电路 。 图 12-42 给 出 了 几 条 指令 逐条 执行 的 时 
间 线 。 方 框 代表 每 个 阶段 的 传播 时 间 。 

周期 1 周期 2 周期 3 





Time 





图 12-42 不 使 用 流水 线 的 指令 执行 


图 12-42 中 的 情况 类 似 于 一 个 要 制造 家 具 的 工匠 ， 他 的 作坊 用 所 有 工具 来 做 三 件 事 : 切 
割 木头 、 装 配 和 上 漆 。 因 为 只 有 一 位 工匠 ， 所 以 他 会 按照 这 样 的 顺序 来 制造 家 具 ， 然 后 一 件 
一 件 地 做 。 如 果 再 有 两 位 工 折 ， 便 有 几 种 方法 来 增加 每 天 能 完成 的 家 具 数 量 。 其 他 工匠 如 果 
有 自己 的 工具 ,那么 三 个 工匠 可 以 并 发 工作 ， 同 时 为 三 件 家 具 切 割 木 头 、 装 配 和 上 潜 。 单 位 
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时 间 的 输出 确实 会 是 原来 的 三 倍 ， 但 是 额外 的 工具 也 是 一 笔 开销 。 

一 种 更 经 济 的 替代 方法 是 确认 当 某 人 正在 用 螺丝 和 胶水 进行 装配 时 ， 切 割 木头 的 工具 可 
以 用 于 制造 下 一 件 家 具 。 类 似 地 ， 当 第 一 件 家 具 上 漆 时 ,第 二 件 在 组 装 中 ， 第 三 件 则 正在 切 
割 中 。 应 该 可 以 看 出 ， 这 种 组 织 结构 是 工厂 装配 线 线 的 基本 架构 。 

对 应 于 工具 的 资源 是 上 面 列 出 的 五 个 方面 的 组 合 电路 : 取 指 、 指 令 译 码 / 寄存 器 文件 读 、 
执行 /地 址 计算 、 内 存 访 问 和 写 回 。CPU 流水 线 的 理念 是 把 执行 一 条 指令 花费 的 周期 数 增加 
为 原来 的 5 倍 ， 但 是 把 每 个 周期 的 时 间 降 低 为 原来 的 115。 初 看 上 去 这 样 做 没有 什么 好 处 ， 
但 是 把 指令 和 指令 的 执行 重生 起 来 ， 就 能 获得 并 行 性 ， 增 加 每 秒 执行 的 指令 数 。 

要 实现 这 个 想法 需要 对 图 12-40 的 数据 路 径 做 一 些 修改 。 每 个 阶段 的 结果 必须 保存 ， 以 
作为 下 一 阶段 的 输入 。 在 这 五 个 阶段 之 间 的 边界 要 放 一 组 寄存 器 ， 如 图 12-43 所 示 。 在 每 个 
新 的 缩短 了 的 周期 结束 前 ， 每 条 要 送 到 下 个 阶段 的 数据 路 径 的 数据 都 要 存放 在 边界 寄存 器 中 。 






L1 instruction cache 
Address 
Instruction 






IF 
取 指 


et i be IF/ID 寄存 器 


ID 
指令 译 码 / 读 寄 存 器 文件 


ID/Ex 寄存 器 


Ex 
执行 /计算 地 址 


Ex/Mem 寄存 器 


Mem 


内 存 访 问 
Mem/WB 寄 存 器 


WB 
写 回 


图 12-43 ”使 用 流水 线 的 MIPS 数据 区 
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只 有 当 每 个 阶段 的 传播 时 延 完 全 相等 时 ， 周 期 时 间 才 能 刚好 降低 为 原来 的 1/5。 实 际 上 
这 些 周期 只 是 大 臻 相等 ， 所 以 新 周期 时 间 是 所 有 缩短 过 的 阶段 中 延迟 最 长 的 阶段 的 传播 时 
间 。 实 现 流水 线 要 选择 把 边界 寄存 器 放 在 哪里 ， 设 计 者 必须 设法 均匀 划分 这 些 阶段 。 

图 12-44 展示 了 流水 线 
是 如 何 工 作 的 。 起 始 时 流水 周期 | 112131415161718 
线 是 空 的 。 在 周期 1， 第 一 时 间 
条 指令 取 指 。 在 周期 2， 第 
二 条 指令 取 指 ， 同 时 第 一 条 
指令 译 码 和 读 寄 存 器 组 。 在 
周期 3， 第 三 条 指令 取 指 ， 
同时 第 二 条 指令 译 码 和 读 寄 
存 器 组 ， 第 一 条 指令 执行 ， 
以 此 类 推 。 这 样 做 能 带 来 加 
速 是 因为 这 使 得 更 多 电路 部 图 12-44 ”使 用 流水 线 时 的 指令 执行 
件 可 同时 使 用 。 流 水 线 就 是 
一 种 形式 的 并 行 。 理 论 上 ， 对 于 一 个 完美 的 有 五 个 阶段 的 流水 线 ， 当 流水 线 充满 时 ， 每 秒 执 
行 的 指令 数 能 提高 五 倍 。 

这 是 好 消息 ， 不 过 也 有 坏 消 息 ， 有 些 问 题 会 破坏 这 个 看 上 去 很 美好 的 画面 。 这 样 的 问题 
分 为 两 类 ， 称 为 冒险 (hazard): 

e 控制 冒险 ,来 自 无 条 件 和 条 件 分 支 . 

he eke sh dp i ite 

phir a tara eel 能 在 流水 线 的 某 个 阶段 执行 完 任务 ， 因 为 它 需 要 前 面 尚未 
执行 完毕 指令 的 结果 。 i a he 个 
气泡 ， 必 须 将 其 清除 ， 然 后 才 可 能 达到 峰值 性 能 。 

图 12-45a 展示 的 是 没有 冒险 时 流水 线 从 起 始 时 的 执行 。 第 一 行 第 二 组 五 个 方块 表示 要 
执行 的 第 6 条 指令 ， 第 二 行 的 第 二 组 表示 第 7 条 指令 ， 以 此 类 推 。 从 第 5 个 周期 开始 ， 这 个 
流水 线 就 开始 以 峰值 性 能 运行 了 。 

LL1213141516171819110l11112113114115116117118119120121122123124|25126| 
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a) 无 冒险 
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b) 分 支 冒险 
图 12-45 ”冒险 对 流水 线 的 影响 
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考虑 分 支 指令 执行 时 会 发 生 什么 。 设 指令 7 是 一 条 分 支 指令 ， 它 从 周期 7 第 二 行 开始 。 
假设 更 新 过 的 程序 计数 器 要 到 这 条 指令 完成 时 才能 为 第 


二 条 指令 所 用 ， 那 么 指令 8 及 其 后 面 的 指令 都 必须 停顿 。 = 
图 12-45b 中 气泡 是 未 加 阴影 的 。 结 果 看 上 去 就 像 流水 线 必 人 
须 在 周期 12 重新 开始 。 图 12-46 显示 分 支 指令 占 到 MIPS 算术 50% 
机 器 上 典型 程序 中 15% 的 执行 语句 。 所 以 大 概 每 7 条 指令 装 人 /存储 35% 
就 要 延迟 四 个 周期 。 分 支 15% 


有 几 种 方法 可 降低 控制 冒险 带 来 的 性 能 处 罚 。 图 12-45b 
假设 分 支 指令 的 结果 要 到 写 回 阶段 之 后 才能 得 到 ， 但 是 实 
际 上 分 支 指令 不 改变 寄存 器 组 。 所 以 ， 假设 下 一 条 指令 被 
延迟 了 ， 要 降低 气泡 的 长 度 ， 系 统 就 必须 消除 分 支 指令 的 写 回 阶段 。 增 加 额外 的 控制 硬件 可 
以 把 气泡 的 长 度 从 四 个 周期 减少 到 三 个 . 

对 条 件 分 支 另 外 还 有 一 个 机 会 能 降低 冒险 的 影响 。 假 设 增 加 额外 的 控制 硬件 ， 分 支 的 处 
罚 是 3 个 周期 ， 而 计算 机 执行 下 面 这 个 MIPS 程序 : 

beq $s1,$s2,4 

add $s3,$s3,$s4 

sub $s5,$s5,$s6 

andi $s7,$s7,15 

sll $s0,$s0,2 

ori $s3,$s3,1 

第 一 条 指令 是 如 果 相 等 分 支 ， 地 址 字段 是 4， 这 意味 着 这 个 分 支 是 到 下 一 条 指令 之 后 的 
第 四 条 指令 。 所 以 ， 如 果 选 择 了 该 分 支 ， 就 会 是 ori 指令 。 如 果 没 有 选择 分 支 ， 接 下 来 会 执 
行 add。 

从 图 12-45b 中 可 以 看 到 浪费 了 很 多 并 行 性 。 随 着 气泡 被 冲洗 出 流水 线 ， 很 多 阶段 都 是 
空闲 的 。 在 等 待 beq 的 结果 时 ， 不 知道 是 否 该 执行 add、sub 和 andi。 不 过 还 是 可 以 假设 分 
支 不 发 生 而 执行 它们 。 如 果实 际 上 没有 选择 分 支 ， 那 么 就 刚好 消除 了 气泡 ; 如 果 选 择 了 分 
支 ， 从 气泡 延迟 的 角度 来 说 ， 也 不 会 比 不 执行 beq 后 面 的 指令 更 差 ， 在 那 种 情况 下 ， 是 把 气 
泡 冲 出 流水 线 。 

这 样 做 的 问题 是 需要 电路 来 清理 如 果 假 设 错误 而 选择 了 分 支 之 后 留 下 的 坏 影 响 。 必 须 记 
录 好 中 间 的 所 有 指令 ， 在 发 现 分 支 是 否 跳 转 之 前 ， 不 允许 它们 永久 地 修改 数据 高 速 缓存 或 寄 
存 器 组 。 当 发 现 不 选择 分 支 时 ， 就 可 以 提交 这 些 改变 了 -。 

假设 分 支 不 会 跳 转 是 一 种 原始 的 预测 未 来 的 方法 ， 这 就 好 像 去 看 赛马 时 总 是 把 赌注 压 在 
同一 匹 马上 而 不 管 它 之 前 的 战绩 如 何 。 可 以 让 历史 指引 选择 ， 这 种 技术 称 为 动态 分 支 预测 
(dynamic branch prediction)。 在 分 支 语 名 执行 的 同时 记录 这 个 分 支 是 跳 转 还 是 不 跳 转 ， 如 果 
跳 转 ， 则 记录 它 的 目的 地 址 ， 下 次 这 条 指令 执行 时 ， 就 预测 会 发 生 同 样 的 结果 - 如果 上 一 次 
跳 转 了 ， 那 就 用 分 支 目 的 处 的 指令 填充 流水 线 ， 否 则 就 用 分 支 指令 后 面 的 指令 填充 流水 线 。 

上 述 方法 称 为 一 位 分 支 预测 ， 因 为 只 需要 一 位 就 能 记录 某 个 分 支 是 跳 转 还 是 不 跳 转 。 一 
位 存储 单元 定义 了 一 个 有 两 个 状态 的 有 限 状态 机 ， 两 个 状态 分 别 对 应 于 预测 分 支 是 否 会 跳 
转 。 图 12-47 给 出 的 就 是 这 个 有 限 状 态 机 。 

还 是 用 赛马 的 比喻 ， 可 能 你 不 应 该 这 么 快 改变 要 把 赌注 放 在 哪 匹 马 上 。 假设 有 一 匹 马 你 
已 经 连续 押 注 三 次 并 且 都 赢 了 ， 第 四 次 ， 另 一 匹 马 赢 了 。 你 真 的 想 要 只 根据 这 一 次 结果 而 不 


图 12-46 MIPS 指令 的 执行 频率 
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管 以 前 的 历史 ， 就 把 赌注 压 到 另 一 匹 马 上 ? PRUE PAREN TAN RA ATO. i 
设 内 循环 每 执行 四 次 ， 外 循环 执行 一 次 。 编 译 器 用 条 件 分 支 翻 译 内 循环 的 代码 ， 这 个 分 支 会 
连续 跳 转 四 次 ， 然 后 会 不 跳 转 一 次 ， 终 止 这 次 循环 。 下 面 是 分 支 选择 序列 和 基于 图 12-47 的 
一 位 动态 预测 结果 。 


跳 转 
不 跳 转 跳 转 
预测 预测 
不 跳 转 跳 转 (1) 
人 不 跳 转 


开始 
图 12-47 ”一 位 动态 分 支 预测 的 状态 转换 图 


Mba: YYYYNYYYYNYYYYNYYYYN 

预测 : NYYYYNYYYYNYYYYNYYYY 

不 正确 : X XX x xX XX X 

采用 一 位 动态 分 支 预测 ， 对 于 每 次 外 循环 ， 内 循环 的 分 支 总 是 会 被 预测 错误 两 次 。 

要 克服 这 个 不 足 ， 常 见 的 做 法 是 采用 两 位 来 预测 下 一 个 分 支 ， 其 思想 是 如 果 分 支 有 多 次 
跳 转 ， 然 后 遇 到 一 次 不 跳 转 ， 那 么 不 用 立即 改变 预测 ; 改变 的 条 件 是 有 两 次 连续 的 不 跳 转 。 
图 12-48 显示 共有 四 种 状态 。 两 个 带 阴 影 的 状态 是 连续 有 两 个 一 样 的 分 支 类 型 时 的 状态 : 前 
面 两 次 分 支 都 跳 转 或 者 都 不 跳 转 。 两 个 没有 阴影 的 状态 表示 前 面 两 次 分 支 结 果 不 同 。 如 果 是 
连续 的 分 支 跳 转 ， 就 处 于 状态 00。 如 果 下 一 个 分 支 是 不 跳 转 ， 则 进入 状态 01， 但 是 仍然 预 
测 此 后 的 分 支 会 跳 转 。 图 12-48 的 有 限 状态 机 按照 上 述 分 支 序 列 执行 的 结果 表明 ， 从 外 层 循 
环 开 始 每 次 预测 都 是 正确 的 。 


跳 转 不 跳 转 
C 7 预测 预测 
跳 转 (00) 跳 转 (01) 

跳 转 





跳 转 


不 跳 转 





ABE 
wi 预测 
BEE (11) BEE (10) en 

Bie 


开始 
图 12-48 ”两 位 动态 分 支 预测 的 状态 转换 图 


男 一 项 技术 用 于 深度 流水 线 ， 在 深度 流水 线 上 如 果 分 支 预测 错误 ,处罚 会 更 严重 。 这 
项 技术 是 复制 流水 线 ， 有 两 份 程序 计数 器 、 取 指 电路 和 所 有 其 余部 分 。 译 码 一 条 分 支 指 令 
时 ， 启 动 这 两 条 流水 线 ， 其 中 一 条 装 和 人 假设 分 支 不 跳 转 的 指令 ， 另 一 条 装 人 假设 分 支 跳 转 的 
指令 。 如 果 发 现 哪 条 流水 线 是 正确 的 ， 就 丢掉 另 一 条 ， 继 续 执行 正确 的 。 这 个 解决 方案 很 昌 
贵 ， 但 不 管 分 支 是 跳 转 还 是 不 跳 转 ， 都 没有 气泡 。 
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当 一 条 指令 需要 前 面 指令 的 结果 时 ， 就 必须 停顿 直到 得 到 该 结果 ， 此 时 数据 冒险 就 发 生 
了 。 这 种 是 写 后 读 (Read-After-Write, RAW) 冒险 ， 下 面 的 代码 序列 就 是 这 样 一 个 例子 : 

add $s2,$s2,$s3 # write $s2 

sub $s4,$s4,$s2 # read $s2 

add 指令 改变 $s2 的 值 ， 这 个 值 用 在 sub 指令 。 图 12-43 表明 add 指令 会 在 写 回 阶段 
WB 结束 时 更 新 $s2 的 值 。 然 后 ，sub 指令 会 在 它 的 指令 译 码 / 寄存 器 文件 读 阶段 ID 结束 时 
从 寄存 器 组 读 出 。 图 12-49a 显示 了 没有 RAW 冒险 的 两 条 指令 ， 图 12-49b 给 出 了 有 数据 冒 
险 时 这 两 条 指令 该 如 何 重奏 。sub 指令 的 ID 阶段 必须 在 add 指令 的 WB 阶段 之 后 。 结 果 是 
sub 指令 必须 停顿 ， 产 生 三 个 周期 的 气泡 。 





add $s2,$s2,$s3 


sub $s4,$s4,$s2 





b) 有 RAW 冒险 的 连续 指令 
图 12-49 RAW 数据 冒险 对 流水 线 的 影响 


如 果 在 add 和 sub 之 间 有 另外 一 条 指令 没有 冒险 ， 就 只 有 两 个 周期 的 气泡 。 如 果 它 们 之 
间 有 两 条 没有 冒险 的 指令 ， 气 泡 就 会 减少 到 一 个 周期 ， 而 如 果 有 三 条 ， 就 没有 气泡 了 。 观 察 
到 这 些 就 有 一 种 可 能 的 方法 。 如 果 能 够 在 附近 找到 一 些 没有 冒险 而 且 无 论 分 支 结 果 如 何 都 
会 执行 的 指令 ， 为 什么 不 乱 序 执行 它们 ， 把 它们 插入 到 add 和 sub 指令 之 间 填 充气 泡 呢 ? 反 
对 这 样 做 的 理由 是 改变 指令 执行 的 顺序 可 能 会 改变 算法 的 结果 。 在 有 些 情况 中 是 这 样 , 但 是 
也 不 全 是 。 如 果 一 个 代码 块 中 有 很 多 算术 运算 ， 则 优化 编译 器 会 分 析 数 据 依 赖 ， 重 新 调整 语 
句 ， 减 少 流 水 线 中 气泡 的 数量 ， 而 又 不 改变 算法 的 结果 。 同 样 ， 一 个 汇编 语言 程序 员 也 可 以 
做 同样 的 事情 。 

这 是 一 个 抽象 付出 代价 的 例子 。 一 层 抽 象 本 意 是 通过 隐藏 低层 的 细节 简化 某 一 层 上 的 计 
算 。 如 果 汇 编 语言 程序 员 或 编译 器 设计 者 不 了 解 LG1 层 流 水 线 的 细节 ， 就 能 生成 对 ISA3 层 
最 方便 的 语句 顺序 ， 那 么 ， 事 情 当然 会 更 容易 。 增 加 一 层 抽 象 总 是 会 带 来 性 能 损失 。 问 题 是 
简化 带 来 的 好 处 能 不 能 弥补 性 能 损失 。 使 用 LG1 层 的 具体 细节 是 为 了 平衡 性 能 的 简化 抽象 。 
这 样 平衡 的 另 一 个 例子 是 在 设计 ISA3 程序 时 考虑 高 速 缓存 子 系统 的 属性 。 

另 一 项 称 为 数据 转发 ( data forwarding) 的 技术 能 减轻 数据 冒险 。 图 12-43 表明 来 自 
ALU 的 加 法 指令 的 结果 会 在 Ex 阶段 结束 时 随时 钟 进入 一 个 Ex/Mem 边界 寄存 器 。 对 于 加 法 
指令 ， 只 需 在 Mem 阶段 结束 时 把 结果 送 入 Mem/WB 边界 寄存 器 ， 最 终 在 WB 阶段 结束 时 
进入 寄存 器 组 。 如 果 在 包含 add 结果 的 Ex/Mem 寄存 器 和 一 个 ID/Ex 寄存 器 ( sub 从 这 个 寄 
存 器 获取 来 自 寄存 器 组 的 add 运算 结果 ) 之 间 建 立 一 条 路 径 ， 那 么 对 图 12-49b 唯一 要 做 的 
调整 就 是 让 sub 的 ID 阶段 在 add 的 Ex 阶段 之 后 。 这 样 做 还 是 会 有 一 个 气泡 ， 但 是 只 有 一 个 
周期 。 
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超标 量 ( superscalar) 设计 利用 的 是 如 果 两 条 指令 没有 数据 依赖 ,那么 它们 就 能 并 行 执 
行 。 图 12-50 给 出 了 两 种 方法 。 图 12-50a 表明 可 以 建立 两 条 独立 的 流水 线 ， 它 有 一 个 速度 [769] 
足够 快 的 取 指 单元 ， 能 够 一 个 周期 取出 多 条 指令 ， 还 能 够 每 个 周期 并 发 地 发 射 两 条 指令 。 这 
样 调度 比较 复杂 ， 因 为 要 管理 跨 两 条 流水 线 的 数据 依赖 。 


a cE 
Hcp lan il 


a) 双流 水 线 


b ) 多 执行 单元 
图 12-50 超标 量 机 器 


图 12-50b 是 基于 这 样 一 个 事实 ， 执 行 单元 Ex 通常 是 执行 链 中 最 薄弱 的 一 环 ， 因 为 它 的 
传播 延迟 比 流水 线 中 其 他 阶段 要 长 。 和 整数 处 理 电 路 相 比 ， 浮 点 单元 尤其 耗 时 。 图 中 标识 为 
FP 的 方 框 是 一 个 浮 点 单元 ， 实 现 的 是 IEEE 754。 每 个 执行 单元 可 能 比 流水 线 中 其 他 阶段 慢 
三 倍 。 但 是 ， 如 果 它 们 的 输入 /输出 能 错开 ， 并 且 能 并 行 工作 ， 执 行 阶段 就 不 会 拖 慢 整个 流 

超标 量 机 器 中 ， 指 令 调 度 器 必须 考虑 其 他 类 型 的 数据 冒险 。 当 一 条 指令 在 前 面 一 条 指令 
读 一 个 寄存 器 之 后 写 这 个 寄存 器 ， 就 会 发 生 读 后 写 (Write-After-Read, WAR) 冒险 。 下 面 
是 一 个 MIPS 代码 的 例子 。 

add $s3,$s3,$s2 # read $s2 

sub $82,$s4,$s5 # write $s2 

在 图 12-43 的 流水 线 化 的 机 器 中 ， 这 个 序列 没有 冒险 ， 因 为 add 在 ID 阶段 结束 时 把 $s2 
随时 钟 送 入 ID/Ex 寄存 器 中 ， 而 sub 会 在 WB 阶段 结束 时 写 这 个 寄存 器 。 超 标量 机 器 会 为 了 
减少 气泡 调整 这 些 指 令 的 顺序 ， 所 以 它 可 能 先 启动 sub 指令 ， 然 后 再 启动 add。 如 果 这 样 做 
的 话 ， 必 须 确保 sub 的 WB 阶段 在 add 的 ID 阶段 之 后 到 达 。 

在 完美 的 流水 线 中 ， 使 用 k 阶段 流水 线 会 把 时 钟 频 率 增 加 为 原来 的 k 倍 ， 性 能 也 提高 为 
原来 的 k 倍 。 那 为 什么 不 能 把 这 种 设计 发 挥 到 极致 ， 让 一 个 周期 等 于 一 个 门 延 迟 呢 ? 因为 由 
控制 冒险 和 数据 冒险 引起 的 复杂 性 会 降低 性 能 ， 无 法 得 到 完美 的 结果 。 总 会 到 一 个 点 ， 增 加 
流水 线 的 长 度 和 增加 频率 会 降低 性 能 。 

但 是 提升 时 钟 频率 还 有 一 个 好 处 : 广告 。 个 人 电脑 的 时 钟 频率 是 消费 者 决定 购买 哪 一 种 
电脑 时 的 重要 因素 。 时 钟 频率 神话 是 说 两 台 具 有 不 同时 钟 频率 值 的 机 器 ， 时 钟 频 率 更 高 的 机 
器 性 能 也 更 高 。 你 现在 应 该 能 明白 为 什么 这 个 神话 不 是 真 的 了 。 增 加 流水 线 中 阶段 的 数量 会 
提高 频率 ,但 是 也 会 增加 冒险 带 来 的 性 能 处 罚 。 问 题 是 设计 是 否 能 有 效 战胜 这 些 处 罚 。 使 用 
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时 钟 频率 作为 衡量 性 能 的 唯一 度量 还 忽略 了 图 12-33 中 性 能 公式 因素 之 间 的 相互 作用 。 终 极 
问题 不 仅 是 CPU 每 秒 包 含 多 少 周 期 ， 还 有 每 个 周期 能 做 多 少 有 效 工作 来 执行 程序 。 

计算 历史 发 展 到 的 现在 ， 流 水 线 技术 已 经 到 达 一 个 平台 期 。 虽 然 商 用 CPU 芯片 的 时 钟 
速度 还 在 提升 ， 但 是 提升 速度 已 经 大 不 如 前 。 摩 尔 定律 依然 有 效 ， 数 字 电 路 工程 师 能 够 在 芯 
片 的 每 平方 毫米 提供 更 多 的 门 ， 但 是 CPU 设计 的 当前 趋势 是 使 用 额外 的 电路 简单 地 复制 整 
个 CPU， 在 一 个 封装 中 装 进 多 个 CPU 核 。 这 种 趋势 未 来 还 会 加 剧 。 这 意味 着 软件 设计 者 要 
面临 更 大 的 挑战 ， 要 使 用 像 8.3 节 介 绍 过 的 那些 并 行 编程 技术 来 利用 多 核 CPU 芯片 提供 的 
能 力 。 


12.4 结论 


Pep/9 说 明 的 是 冯 “' 诺 依 曼 计 算 机 的 基本 本 质 。 数 据 区 由 组 合 电路 和 时 序 电 路 组 成 ， 是 
一 个 大 的 有 限 状 态 机 。 数 据 区 的 输入 包括 来 自主 存 的 输入 和 来 自控 制 区 的 控制 信号 ， 数 据 区 
的 输出 也 送 往 主 存 和 控制 区 。 每 当 控 制 区 向 状态 寄存 器 发 送 时 钟 脉冲 时 ， 状 态 机 就 转换 到 一 
个 不 同 的 状态 。 

在 真实 的 计算 机 中 ， 状 态 的 数量 非常 大 ,但 还 是 有 限 的 。 图 12-2 中 的 Pep/9 数据 区 有 
25 个 可 写 的 8 位 寄存 器 和 5 个 状态 位 ， 对 于 总 共 205 位 存储 ， 有 2” 个 状态 。 有 8 个 输入 
来 自主 系统 总 线 的 数据 线 ，34 个 控制 输入 来 自控 制 区 ， 每 个 状态 的 转移 数 是 2 。 考 虑 作为 
一 个 有 限 状 态 机 ， 该 机 器 转移 的 总 数 是 2°° 乘 以 2 ， 即 2%=10*。 地 球 上 原子 的 个 数 估计 只 
有 10”， 而 Pep/9 只 是 一 台 很 小 的 计算 机 ! 在 最 基本 的 层面 上 ， 无 论 系统 多 么 复杂 ， 计 算 都 
不 过 是 执行 一 个 有 外 围 存储 的 有 限 状态 机 。 


12.4.1 模型 简化 


Pep/9 计算 机 说 明了 真实 的 汉 … 诺 依 曼 机 器 背后 的 基本 组 织 思 想 。 当 然 ， 还 是 进行 了 很 
多 简化 以 使 机 器 简单 易 懂 。 

有 一 个 低层 细节 与 实际 硬件 实现 中 有 所 不 同 ， 那 就 是 在 整个 集成 电路 中 使 用 的 是 边沿 触 
发 的 触发 需 ， 而 不 是 主 从 触发 避 。 这 两 种 触发 器 都 能 解决 反馈 问题 。 因 为 主 从 原理 比 边沿 触 
发 原理 更 容易 理解 ， 所 以 描述 中 全 都 使 用 的 是 主 从 触发 器 。 

另 一 个 简化 是 使 用 主 系统 总 线 的 CPU 和 主 存 之 间 的 接口 。 在 真实 的 计算 机 中 ， 时 序 约 
束 要 更 复杂 ， 不 是 简单 地 把 地 址 放 到 总 线 上 ,使 MemRead 保持 有 效 且 等 待 3 周期， 并 假设 
数据 就 能 够 随时 钟 送 进 MDR 中 。 一 次 内 存 访问 要 求 不 止 两 个 周期 ， 相 关 协 议 更 详细 地 说 明 
地 址 线 必须 保持 有 效 的 时 长 ， 以 及 数据 必须 随时 钟 送 入 CPU 寄存 器 中 的 确切 时 间 。 

有 关 主 系统 总 线 的 男 一 个 问题 是 它 是 如 何在 CPU、 内 存 和 外 围 设备 之 间 共 享 。 实 际 中 ， 
CPU 并 不 总 是 控制 着 总 线 。 相 反 ， 如 果 同 时 有 多 个 设备 想 要 使 用 总 线 ， 总 线 会 使 用 自己 的 
处 理 器 在 竞争 的 设备 之 间 进 行 仲裁 。 一 个 例子 是 使 用 直接 内 存 访 问 (Direct Memory Access, 
DMA)， 数 据 从 磁盘 直接 通过 总 线 送 到 主 存 ， 不 受 CPU 控制 。DMA 的 优点 是 CPU 能 够 把 
它 的 周期 用 在 执行 程序 的 有 用 工作 上 ， 而 不 必 分 心 控制 外 围 设备 。 

其 他 一 些 超 出 本 书 讨论 范围 的 议题 包括 汇编 器 宏 、 链 接 器 、 流 行 的 外 围 总 线 (比如 USB 
和 Thumder bolt)、 超 级 计算 机 以 及 整个 计算 机 网 络 领域 。 学 习 计算 机 网 络 时 ， 你 会 发 现 抽 
象 是 核心 。 计 算 机 系统 被 设计 为 抽象 层次 ， 每 一 层 的 细节 都 向 上 一 层 隐 藏 ， 因 特 网 通信 协议 
也 是 这 样 设计 的 。 每 一 抽象 层 的 存在 都 只 做 一 件 事情 ， 向 更 高 的 一 层 提供 服务 ， 而 隐藏 如 何 
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提供 服务 的 细节 。 


12.4.2 全 局 架构 


现在 考虑 从 App7 层 一 直 向 下 到 LG1 层 的 整个 结构 。 假 设 用 户 从 App7 的 一 个 应 用 程序 
向 数据 库 系统 输入 数据 。 她 想 录 入 一 个 数值 ， 所 以 敲 出 这 个 值 ， 并 执行 回 车 命令 。 这 样 一 个 
看 似 无 害 的 举动 后 面 发 生 了 什么 呢 ? 

C 程序 员 编 写 的 数据 库 系统 包括 输入 数值 的 过 程 。 这 个 C 程序 编译 成 汇编 语言 ， 然 后 又 
被 汇编 成 机 器 语言 。 编 译 器 设计 者 编写 编译 器 ， 而 汇编 器 设计 者 编写 汇编 器 。 编 译 器 和 汇编 
器 是 自动 翻译 器 ， 都 包含 词法 分 析 阶 段 、 语 法 分 析 阶 和 代码 生成 阶段 ， 其 中 词法 分 析 阶 段 是 
基于 有 限 状 态 机 的 。 

在 数值 输入 过 程 中 ，C 程序 员 也 使 用 有 限 状 态 机 。 编 译 器 把 过 程 中 每 条 C 语句 翻译 成 多 
条 汇编 语言 语句 。 不 过 汇编 器 会 把 每 条 汇编 语言 语句 翻译 成 一 条 机 器 语言 语句 。 所 以 处 理 用 
户 回 车 命令 的 代码 会 扩展 成 多 条 C 命令 ， 而 每 条 C 命令 又 会 扩展 成 多 条 ISA3 层 命令 。 

然后 ， 每 个 ISA3 层 命令 会 被 翻译 成 控制 区 信号 来 获取 和 执行 指令 。 每 个 控制 信号 输入 
一 个 复 用 器 或 某 个 其 他 组 合 设备 ， 或 者 这 个 信号 是 一 个 脉冲 ， 让 一 个 值 随 着 时 钟 进入 状态 寄 
存 器 。 时 序 电 路 也 受 有 限 状 态 机 的 规则 管理 。 

每 个 寄存 器 都 是 一 个 触发 器 阵列 ， 每 个 触发 器 都 是 一 对 以 主 从 原理 设计 的 锁 存 器 。 每 个 
锁 存 器 都 是 一 对 NOR 门 以 及 简单 的 交叉 耦合 反馈 连接 。 数 据 区 的 每 个 组 合 部 件 都 是 很 少 几 
种 类 型 的 门 的 互联 。 每 个 门 的 行为 都 受 布尔 代数 定律 的 控制 。 最 终 ， 用 户 的 回 车 命令 被 翻译 
成 电子 信号 ， 在 各 个 门 中 流动 。 

如 果 在 多 道 程序 设计 系统 中 执行 ， 用 户 的 回 车 命令 可 能 会 被 操作 系统 中 断 。 回 车 命令 
可 能 会 产生 缺 页 ， 这 种 情况 下 操作 系统 可 能 需要 执行 页 替换 算法 ， 确 定 要 把 哪 一 页 复制 回 
磁盘 。 

当然 ， 这 些 事件 都 是 在 用 户 对 系统 低层 毫 不 知情 的 情况 下 发 生 的 。 任 何 一 层 的 设计 缺陷 
都 会 减缓 处 理 ， 用 户 会 感知 到 并 且 抱 怨 计算 机 。 记 住 ， 从 App7 到 LG1， 整 个 系统 设计 都 受 
到 基本 的 空间 / 时 间 折 中 的 制约 。 

LG1 层 上 通过 某 个 复 用 器 的 一 个 门 的 信号 和 App7 层 上 执行 回 车 命令 的 用 户 之 间 的 关联 
看 起 来 很 遥远 ， 但 是 它 真实 存在 。 实 际 上 有 上 百 万 的 门 在 协同 工作 来 执行 用 户 的 任务 。 这 人 么 
多 设备 能 够 被 组 织 成 一 台 有 用 的 机 器 正 是 得 益 于 把 系统 构造 成 不 同 的 抽象 层次 。 

每 个 抽象 层次 都 只 有 少量 的 简单 概念 ， 这 真 的 很 惊人 。 在 LG1 J, RH NAND 或 者 
NOR 门 就 足以 构造 任何 组 合 电路 。 只 有 四 种 基本 的 触发 器 类 型 ， 它 们 都 可 以 用 SR 触发 器 实 
现 。 简 单 的 冯 “' 诺 依 曼 周 期 是 机 器 运行 背后 ISA3 层 的 控制 力量 。 在 0S4 层 ， 进 程 是 一 个 运 
行 着 的 程序 ， 可 以 通过 存储 它 的 进程 控制 块 来 中 断 它 。Asmbs 层 的 汇编 语言 是 到 机 器 语言 
的 一 对 一 简单 翻译 。HOL6 层 的 高 级 语言 是 到 低级 语言 的 一 对 多 翻译 。 

有 限 状 态 机 的 概念 在 整个 层次 结构 中 随处 可 见 。 有 限 状 态 机 是 自动 翻译 器 词法 分 析 的 基 
础 ， 也 用 来 描述 时 序 电路 。 进 程控 制 块 存储 着 进程 的 状态 。 

所 有 科学 都 以 简单 和 结构 化 作为 目标 。 在 自然 科学 中 ， 人 们 致力 于 发 现 自然 法 则 ， 用 最 
少 的 数学 定律 或 概念 来 解释 大 多 数 现 象 。 计 算 机 科学 家 也 发 现 简单 是 控制 复杂 的 关键 。 能 
建造 出 像 计 算 机 这 样 复杂 的 机 器 ， 完 全 是 因为 在 每 个 抽象 层次 只 需要 简单 的 概念 来 控制 它 的 
行为 。 
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本 章 小 结 


中 央 处 理 器 单元 (CPU) 分 为 数据 区 和 控制 区 。 数 据 区 有 一 个 寄存 器 组 ， 部 分 或 全 部 
对 ISA3 层 程 序 员 可 见 。 处 理 是 一 个 循环 ,来 自 寄存 器 组 的 数据 通过 ABus 和 Bbus， 通 过 
ALU， 再 通过 CBus 返回 寄存 器 组 。 内 存 地 址 寄存 器 指定 地 址 处 的 数据 通过 主 系统 总 线 和 内 
存 数 据 寄存 器 从 内 存 注 入 循环 中 。 

控制 区 的 功能 是 向 数据 区 发 送 控制 信号 序列 ， 实 现 ISA3 指令 集 。 机 器 由 冯 “' 诺 依 曼 周 
期 控制 : 取 指 、 译 码 、 增 加 、 执 行 和 重复 。 在 像 Pep/9 这 样 的 CISC 机 器 中 ， 控 制 信号 必须 
引导 数据 区 取 操 作 数 ， 由 于 寻 址 方式 复杂 ， 这 可 能 要 花费 很 多 周期 。 像 MIPS 这 样 的 RISC 
机 器 则 寻 址 方式 较 少 ， 指 令 比较 简单 ， 使 得 每 条 指令 的 执行 都 只 需要 一 个 周期 。 

提高 性 能 可 能 来 自 于 三 个 方面 : 增加 数据 总 线 的 宽度 、 在 CPU 和 主 存 之 间 插 入 高 速 组 
存 ， 以 及 使 用 流水 线 。 这 三 种 途径 全 部 都 建立 在 基本 的 空间 /时 间 折 中 基础 上 。 

增加 数据 总 线 宽 度 需要 把 更 多 空间 用 于 总 线 上 的 连 线 、 额 外 的 数据 寄存 器 以 及 CPU 数 
据 区 的 总 线 。 增 加 的 空间 可 能 会 减少 主 存 与 CPU 之 间 数 据 传递 的 时 间 。 所 有 的 计算 机 内 存 
都 是 字 节 寻 址 的 ， 利 用 比 一 个 字 节 更 宽 的 总 线 来 提高 并 行 性 需要 在 汇编 语言 中 使 用 数据 和 程 
序 的 内 存 对 齐 。 

高 速 缓冲 存储 器 解决 的 是 CPU 的 快速 和 主 存 的 慢 速 之 间 极 端 不 匹配 的 问题 。 高 速 缓存 
是 一 个 小 的 高 速 内 存单 元 ， 包 含 一 部 分 很 可 能 被 CPU 访问 的 主 存 数据 的 副本 。 它 依赖 于 所 
有 真实 程序 中 都 会 表现 出 的 引用 的 空间 和 时 间 局 部 性 。 

所 有 性 能 提升 都 基于 下 面 这 个 性 能 公式 中 执行 时 间 的 3 个 组 成 部 分 : 

时 间 _ 指令 数 时 钟 周期 数 m 时 间 
程序 程序 程序 时 钟 周期 

CISC 机 器 会 降低 第 一 个 因素 ， 代 价 是 提高 第 二 个 因素 。RISC 机 器 ， 或 者 称 为 装 人 / 存 
储 机 器 会 降低 第 二 个 因素 ， 代 价 是 提高 第 一 个 因素 。 这 两 种 组 织 方法 都 会 用 第 三 个 因素 来 提 
高 性 能 ， 主 要 是 通过 流水 线 。 

具有 复杂 指令 和 较 多 寻 址 方式 的 计算 机 在 计算 历史 早期 比较 流行 。 它 们 的 特征 之 一 就 是 
Mc2 层 抽 象 ， 这 层 抽象 中 控制 区 有 自己 的 微 内 存 、 微 程序 计数 器 和 微 指 令 寄 存 器 。 控 制 区 的 
微 程 序 产生 实现 ISA3 指令 集 的 控制 序列 。 装 入 / 存储 计算 机 的 特性 是 没有 Me BAR, A 
为 它 的 每 条 简单 指令 都 能 在 一 个 周期 内 实现 。 

流水 线 类 似 于 工厂 里 的 装配 线 。 要 实现 流水 线 就 要 划分 周期 ， 在 数据 区 的 数据 路 径 上 插 
人 边界 寄存 器 。 效 果 是 增加 了 每 条 指令 的 周期 数 ， 但 是 相应 地 降低 了 时 钟 周 期 。 当 流水 线 充 
满 的 时 候 ， 借 助 于 流水 线 固有 的 并 行 性 ， 能 够 实现 每 个 周期 执行 一 条 指令 。 不 过 ， 控 制 冒险 
和 数据 冒险 会 降低 性 能 ， 不 能 达到 理论 上 的 理想 值 。 人 处 理 冒险 的 技术 包括 分 支 预测 、 指 令 重 
排序 以 及 数据 转发 。 超 标量 机 器 通过 复制 流水 线 或 执行 单元 来 实现 更 高 的 并 行 性 。 


练习 


12.1 节 
1. MH MDR 和 主 存 总 线 之 间 的 全 部 8 位 总 线 ， 给 出 三 态 缓冲 器 以 及 到 MemWrite 线 的 连接 。 
2. 设计 图 12-2 的 三 输入 单 输出 组 合 电路 ANDZ: 

(a) 用 卡 诺 图 简化 AND-OR 电路 ; 
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(b) 用 卡 诺 图 简化 OR-AND 电路 ; 

(c) 哪 种 设计 较 好 ? 

3. 图 12-7 把 图 12-5 中 的 周期 6 和 周期 2 合并， 周期 7 和 周期 3 合并 ， 以 加 速 汉 : 诺 依 曼 周期 。 可 以 

把 周期 6 和 周期 3 合并 ,周期 7 和 周期 4 合并 吗 ?” 为 什么 ? 

4. 图 12-7 把 图 12-5 中 的 周期 6 和 周期 2 合并， 周期 7 和 周期 3 合并， 以 加 速 汉 : 诺 依 曼 周 期 。 可 以 

把 周期 6 和 周期 4 合并 ， 周 期 7 和 周期 5 合并 吗 ? 为 什么 ? 

12.275 
*5. 书 中 预测 不 需要 从 64 位 计算 机 转变 到 128 位 计算 机 ， 因 为 我 们 不 会 需要 大 于 16012 GiB HEF. 

硅 晶 体 是 一 个 由 0.5 nm 的 方 瓦 片 组 成 的 平面 ， 每 个 瓦 片 由 两 个 原子 组 成 。 

(a) 假设 可 以 制造 一 个 内 存 ， 密 度 高 到 硅 原 子平 面 上 每 个 原子 存储 1 位 (忽略 线 的 互联 问题 )， 要 存 
储 64 位 机 器 可 以 寻 址 的 最 大 字 节 数 ， 正 方形 芯片 的 边 长 应 该 是 多 少 ? 给 出 计算 过 程 。 

(b) 这 个 计算 能 支撑 前 面 的 预测 吗 ? 为 什么 ? 

6. 对 于 图 12-28 的 高 速 缓存 ，CPU 请 求 在 地 址 4675(dec) 的 字 节 。 

(a) 标签 字段 的 9 位 是 什么 ? 

(b) 字 节 字段 的 4 位 是 什么 ? 

(c) 存储 这 个 数据 的 高 速 缓存 单元 是 哪个 ? 

7. CPU 可 以 寻 址 16 MiB 的 主 存 ,使 用 直接 映射 高 速 缓存 ， 其 中 存储 着 256 个 8 字 节 的 高 速 缓存 行 。 

(a) 一 个 内 存 地 址 需要 几 位 ? 

(b) 地 址 的 字 节 字段 需要 多 少 位 ? 

(c) 地 址 的 行 字段 需要 多 少 位 ? 

(d) 地 址 的 标签 字段 需要 多 少 位 ? 

Ce) 每 个 高 速 缓存 条 目的 数据 字段 需要 多 少 位 ? 

(f) 每 个 高 速 缓存 条 目的 所 有 字段 一 共 要 多 少 位 ? 

(g) 整个 高 速 缓存 总 共 需 要 多 少 位 ? 

8. 练习 7 的 CPU 使 用 的 是 两 路 组 相 联 高 速 缓存 ， 带 有 256 个 8 字 节 高 速 缓存 行 。 每 个 高 速 缓存 条 目 
需要 多 少 位 ? 
9. 图 12-30 P, (a) 画 出 比较 器 的 实现 ， 比 较 器 就 是 里 面 有 一 个 等 号 的 圆圈 。( 提 示 : 考虑 XOR 后 面 跟 

一 个 反 相 器 的 真 值 表 ， 有 时 称 为 XNOR 门 。) 

(b) 画 出 128 个 四 输入 复 用 器 的 输入 /输出 连接 。 

(c) 画 出 128 个 四 输入 复 用 器 中 一 个 的 实现 。 在 本 练习 的 (aXb) 的 两 个 部 分 都 可 以 使 用 省 略 号 (...)。 

10. 直接 映射 高 速 缓存 是 高 速 缓存 设计 的 一 个 极端 ， 组 相 联 排 在 中 间 ， 另 一 个 极端 是 全 相 联 高 速 缓存 

( fully-associative cache)， 实 际 上 就 是 图 12-29a 的 高 速 缓存 里 只 有 一 个 条 目 ， 地 址 的 行 字 有 段 为 0， 

也 就 是 没有 行 字 段 ， 地 址 中 只 有 标签 字段 和 字 节 字段 。 

(a) 图 12-29 中 ,不 是 有 8 个 高 速 缓存 单元 ,每 个 4 行 ， 而 是 可 以 用 同样 的 位 数 ， 只 有 1 个 高 速 
缓存 单元 ， 该 单元 有 32 行 。 与 图 12-29 中 的 高 速 缓 存 相 比 ， 这 种 设计 的 命中 率 会 提高 吗 ? 为 
什么 ? 

(b) 对 于 (a) 中 的 高 速 缓存 ， 读 电路 中 需要 多 少 个 比较 器 ? 

11. 假设 CPU 可 以 寻 址 1 MB 的 主 存 ， 使 用 全 相 联 映射 高 速 缓存 (参见 练习 10 )， 其 中 有 16 个 32 字 节 

的 高 速 缓存 行 。 

(a) 一 个 内 存 地 址 需要 几 位 ? 

(b) 地 址 的 字 节 字段 需要 多 少 位 ? 

Co) 地 址 的 标签 字段 需要 多 少 位 ? 

(d) 每 个 高 速 缓存 条 目的 数据 字段 需要 多 少 位 ? 

(e) 整个 高 速 缓存 总 共 需 要 多 少 位 ? 
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12.3% 
*12.(a) 假设 MIPS 机 器 的 C 编译 器 把 $s4 和 数组 a、$s5 和 变量 g、$s6 和 数组 b 联系 在 一 起 。 它 会 把 
语句 
a[l4] = g + b[5]; 
翻译 成 什么 MIPS 汇编 语言 呢 ? 
(b) 写 出 (a) 中 指令 的 机 器 语言 翻译 。 
13. (a) 写 出 MIPS 汇编 语言 语句 ， 把 寄存 器 $s2 的 内 容 左 移 9 位 ， 并 把 结果 放 到 $t5 中 。 
(b) 写 出 (a) 中 指令 的 机 器 语言 翻译 。 
14. (a) 假设 MIPS 机 器 的 C 编译 器 把 $s4 和 变量 g、$s5 和 数组 a、$s6 和 变量 i 联系 在 一 起 。 该 如 何 
把 语句 g=ali] 翻译 成 MIPS 汇编 语言 呢 ? 
(b) Sih (a) 中 指令 的 机 器 语言 翻译 。 
15.(a) 假设 MIPS 机 器 的 C 编译 器 把 $s4 和 变量 g、$s5 和 数组 a、$s6 和 变量 i 联系 在 一 起 。 该 如 何 
把 语句 a[j=g 翻译 成 MIPS 汇编 语言 呢 ? 
(b) 写 出 (a) 中 指令 的 机 器 语言 翻译 。 
16. (a) 假设 MIPS 机 器 的 C 编译 器 把 $s4 和 变量 g、$s5 和 数组 a、$s6 和 变量 i 联系 在 一 起 。 该 如 何 
把 语句 g=a[i+3] 翻译 成 MIPS 汇编 语言 呢 ? 
(b) 写 出 (a) 中 指令 的 机 器 语言 翻译 。 
17. (a) 假设 MIPS 机 器 的 C 编 译 器 把 $s5 和 数组 a、$s6 和 变量 i 联 系 在 一 起 。 该 如 何 把 语句 
a[i]=a[i+1] 翻译 成 MIPS 汇编 语言 呢 ? 
(b) Sih (a) 中 指令 的 机 器 语言 翻译 。 
18.(a) 写 出 MIPS 汇编 语言 语句 ， 在 运行 时 栈 上 分 配 12 字 节 的 存储 空间 。 
(b) 写 出 (a) 中 指令 的 机 器 语言 翻译 。 
19. (a) 假设 MIPS HLAEHY C 编译 器 把 $s5 和 数组 g 联系 在 一 起 。 该 如 何 把 语句 g=529371 翻译 成 MIPS 
汇编 语言 呢 ? 
(b) 写 出 (a) 中 指令 的 机 器 语言 翻译 。 
20.(a) Iw 指令 的 RTL 描述 是 什么 ? 
(b) 对 图 12-40， 写 出 执行 lw 指令 的 控制 信号 。 
21. 图 12-43 A, (a) 两 个 IFAD 边界 寄存 器 中 每 个 有 多 少 位 ? 
(b) 四 个 ID/Ex 边界 寄存 器 中 每 个 有 多 少 位 ? 
(c) 三 个 Ex/Mem 边界 寄存 器 中 每 个 有 多 少 位 ? 
(d) 两 个 Mem/WB 边界 寄存 器 中 每 个 有 多少 位 ? 


778| 22. 对 于 图 12-45b， 在 下 表 中 检查 每 个 周期 空闲 的 电路 ， 列 出 每 个 周期 空闲 的 电路 总 数 。 

















空闲 数 


23. 假设 图 12-45a 的 五 阶段 流水 线 15% 的 时 间 在 执行 分 支 ， 每 个 分 支 导致 接 下 来 要 执行 的 指令 停顿 直 
到 分 支 完 成 ， 如 图 12-45b 所 示 。 
(a) 和 没有 气泡 的 理想 流水 线 相 比 ， 周 期 数 增加 的 百分比 是 多 少 ? 
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(b) 假设 n 阶段 流水 线 x% 的 时 间 执 行 分 支 ， 每 个 分 支 导致 接 下 来 要 执行 的 指令 停顿 直到 分 支 完成 。 
和 没有 气泡 的 理想 流水 线 相 比 ， 周 期 数 增加 的 百分比 是 多 少 ? 
24. 书 中 提 到 在 假设 下 一 条 指令 会 被 延迟 的 情况 下 ， 可 以 消除 无 条 件 分 支 的 写 回 阶段 。 
(a) 使 用 这 样 的 设计 ， 画 出 图 12-45b 的 周期 7 一 16。 
(b) 对 于 该 设计 完成 练习 22 的 表格 。 
25.(a) 图 12-47 中 ， 对 于 一 位 动态 分 支 预测 ， 什 么 样 的 跳 转 结果 会 导致 错误 预测 比率 最 高 ?最 大 比率 
是 多 少 ? 
(b) 图 12-48 中 ， 对 于 两 位 动态 分 支 预测 ， 什 么 样 的 跳 转 结果 会 导致 错误 预测 比率 最 高 ? 最 大 比率 
是 多 少 ? 
26. 构建 图 12-48 的 单 输 入 有 限 状态 机 ， 实 现 两 位 动态 分 支 预 测 ， 用 卡 诺 图 简化 电路 。 
(a) 使 用 两 个 SR 触发 器 。 
(b) 使 用 两 个 JK 触发 器 。 
(c) 使 用 两 个 D 触发 器 。 
(d) 使 用 两 个 T 触 发 器 。 
27. 图 12-48 所 示 的 分 支 预测 有 限 状 态 机 只 有 在 连续 两 次 进行 了 分 支 时 才 从 预测 不 分 支 转换 为 预测 分 支 
(从 预测 分 支 转换 为 预测 不 分 支 的 条 件 与 之 类 似 )。 
(a) 画 出 有 限 状 态 机 ， 它 只 在 连续 三 次 进行 了 分 支 时 才 从 预测 不 分 支 转换 为 预测 分 支 (从 预测 分 支 
转换 为 预测 不 分 支 的 条 件 与 之 类 似 )。 
(b) 实现 这 个 机 器 需要 多 少 预测 位 ? 


编程 题 


本 章 中 的 习题 是 编写 控制 序列 来 实现 Mc2 层 上 的 ISA3 指令 。 对 每 道 习 题 ， 请 在 Pep/9 模拟 器 中 
编写 实现 代码 。 该 应 用 程序 的 帮助 功能 对 每 道 习题 都 有 单元 测试 ， 必 须 使 用 它 来 测试 你 的 实现 。 所 有 
的 习题 请 尽 可 能 使 用 最 少 的 周期 。 

12:4 
28. 用 单字 节 数 据 总 线 编写 控制 序列 实现 冯 “' 诺 依 曼 周 期 来 获取 操作 数 指示 符 ， 并 相应 的 增加 PC。 假 

设 指令 指示 符 已 经 取出 ， 且 控制 部 分 已 经 确定 了 该 指令 是 非 一 元 的 。 

29. 用 单字 节 数 据 总 线 编写 控制 序列 实现 下 列 一 元 ISA3 指令 。 假 设 指 令 已 经 被 取出 ， 且 程序 计数 器 已 

经 增加 。 


*(a) MOVSPA (b) MOVFLGA 
(c) MOVAFLG (d) NOTA 
(e) NEGA (f) ROLA 
(g) RORA 


30. 用 单字 节 数 据 总 线 编写 控制 序列 实现 ASLA 指令 ， 该 指令 对 累加 器 做 算术 左 移 ， 并 把 结果 放 回 累 
加 器 中 。ISA3 层 ASLA 指令 的 RTL 描述 表示 它 会 设置 V 位 ， 当 数字 被 解释 为 有 符号 数 时 设置 这 个 
位 表示 有 溢出 ， 这 与 ASRA 不 同 。 在 Mc2 E, ASLA 指令 实现 的 过 程 是 先 对 低位 字 节 执行 ASL, 
再 对 高 位 字 节 执行 ROL。 虽 然 ROL 操作 不 会 设置 ISA3 层 的 V 位 , 但 是 图 10-55 显示 出 ROL 的 
ALU 功能 确实 在 Mc2 层 计 算 了 V 位 。 因 此 ， 在 ROL 操作 中 可 以 访问 来 自 ALU 的 V 输出。 假设 
指令 已 经 被 取出 且 程 序 计数 器 已 经 增加 。 

31. 用 单字 节 数 据 总 线 编写 控制 序列 实现 下 列 非 一 元 ISA3 指令 。 假 设 指令 已 经 被 取出 ， 且 程序 计数 器 
已 经 增加 。 注 意 操作 数 已 经 在 指令 寄存 器 (OR) 中 。 

*(a) SUBA this,i (b) ANDA this,i 
(c) ORA this,i (d) CPWA this,i 
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(e) CPBA this,i (f) LDWA this,i 
(g) LDBA this,i 

32. 用 单字 节 数 据 总 线 编写 控制 序列 实现 下 列 非 一 元 ISA3 指令 。 假设 指令 已 经 被 取出 ， 且 程序 计数 器 
已 经 增加 。 


*(a) LDWA here,d (b) LDWA here,s 
(c) LDWA here,sf (d) LDWA here,x 
(e) LDWA here,sx (f) LDWA here,sfx 
(g) STWA there,n (h) STWA there,s 
(i) STWA there,sf (j) STWA there,x 
(k) STWA there,sx (1) STWA there,sfx 


33. 用 单字 节 数 据 总 线 编写 控制 序列 实现 下 列 ISA3 控制 指令 。 假 设 指令 已 经 被 取出 ， 且 程序 计数 器 已 
经 增加 。 由 于 DECO 是 个 陷阱 指令 ， 因 此， 其 寻 址 方式 与 实现 无 关 。 所 有 的 陷阱 指令 在 ISA3 层 的 
实现 都 是 相同 的 。 


(a) BR main (b) BR guessJT,x 
(c) CALL alpha (d) RET 
(e) DECO 0x0003,d (f) RETTR 

12.2% 


34. 用 双 字 节 数 据 总 线 编写 控制 序列 实现 冯 “' 诺 依 曼 周期 来 获取 操作 数 指示 符 ， 并 相应 的 增加 PC. 
(a) 假设 程序 计数 器 是 偶数 值 ， 则 操作 数 指示 符 的 第 一 个 字 节 还 未 被 预 取 。 
(b) 假设 程序 计数 器 是 奇数 值 ， 则 操作 数 指示 符 的 第 一 个 字 节 已 经 被 预 取 ， 继 续 预 取 后 续 的 指令 指 
示 符 。 

35. 用 双 字 节 数 据 总 线 编写 控制 序列 实现 习题 32 的 ISA3 指令 。 假设 所 有 地 址 和 字 操 作 数 都 对 齐 于 侦 
地 址 边界 。 与 单字 节 数 据 总 线 所 需 周期 数 进行 比较 ， 并 计算 双 字 节 数 据 总 线 节省 周期 数 的 百分比 。 

36. 用 双 字 节 数 据 总 线 编写 控制 序列 实现 习题 33 的 1SA3 指令 。 假设 所 有 地 址 和 字 操 作 数 都 对 齐 于 侦 
地 址 边界 。 与 单字 节 数 据 总 线 所 需 周 期 数 进行 比较 ， 并 计算 双 字 节 数 据 总 线 节省 周期 数 的 百分比 。 
小 题 (e) 是 陷阱 指令 ， 小 题 (f) 是 从 陷阱 返回 的 指令 ， 它 们 都 假设 有 对 齐 的 系统 栈 。Pep/9 CPU 模 
拟 器 提供 了 对 齐 系统 栈 的 修改 过 的 RTL 描述 以 及 通用 单元 测试 。 

37. 插入 -ALIGN 点 命令 和 NOP0 指令 ， 使 得 下 列 Pep/9 汇编 语言 程序 对 齐 双 字 节 数据 总 线 的 Pep/9 处 
理 器 。 记 住 ， 所 有 的 CALL 语句 都 必须 位 于 奇 地 址 ， 以 便 让 返回 地 址 位 于 偶 地 址 。 未 对 齐 的 原始 
程序 的 源 代码 由 Pep/9 应 用 程序 的 帮助 工具 提供 。 测 试 你 编写 的 对 齐 程序 。 

(a) 图 5-22 
(b) 图 6-10 
(c) 图 6-12 
(d) 图 6-18 
(e) 图 6-21 
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Pep/9 体系 结构 





本 附录 总 结 了 Pep/9 计算 机 的 体系 结构 。 








sf 


112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 T 


128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 
144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 


160 161 162 163 164 165 166 167 168 169 170 171 
176 177 178 179 180 181 182 183 184 185 186 187 


_ 192 193 194 195 196 197 198 199 200 201 202 203 
208 209 210 211 212 213 214 215 216 217 218 219 
224 225 226 227 228 229 230 231 232 233 234 235 
240 241 242 243 244 245 246 247 248 249 250 251 


bs | 
o 
人 
2 
x a 
Pa 
5 
6_ 
Ls 
8_ 
9 
A 
B_ 
D_ 
E 
F 





图 A-1 十 六 进 制 转换 表 


0000 





4 0100 8 1000 € 1100 
0001 5 0101 9 1001 D 1101 
0010 6 0110 A 1010 E 1110 
0011 7 0111 B 1011 F 1111 


图 A-2 十 六 进 制 和 二 进 制 的 关系 
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NUL 0000000 00 
SOH 0000001 01 
STX 0000010 02 
ETX 0000011 03 
EOT 0000100 04 
ENQ 0000101 05 
ACK 0000110 06 
BEL 0000111 07 
BS 0001000 08 
HT 0001001 09 
LF 000 1010 OA 
VT 0001011 0B 
FF 0001100 0C 
CR 0001101 op 
SO 0001110 0E 
SI 0001111 OF 
DLE 0010000 10 
DC1 0010001 11 
DC2 0010010 12 





001 1000 18 
EM 0011001 19 
SUB 0011010 1A 








NUL 

SOH 

STX 正文 开始 

ETX 正文 结束 

EOT 传输 结束 

ENQ 请 求 

BEL 
BS 
HT 
LF 
VI 


工 = 


mV i Ax 


+ # 一 一 -各 op 


DPOFAUAWNPRO~、. 
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010 0000 
010 0001 
010 0010 
010 0011 
010 0100 


010 0101- 


0100110 


— O10 0111 


010 1000 
010 1001 
010 1010 
010 1011 
010 1100 
010 1101 
010 1110 
010 1111 
011 0000 
011 0001 
011 0010 


011 0011 | 


011 0100 
011 0101 
O11 0110 
O11 0111 
011 1000 
011 1001 
011 1010 
011 1011 


011 1100 


O11 1101 


0111110 


O11 1111 


















控制 符 的 缩写 


20 8 100 0000 40 
21 A 1000001 41 
22 B 1000010 42 
23 c 1000011 43 
24 D 1000100 44 
25 E 100 0101 45 
26 F 1000110 46 
Zz G WOOL 47 
28 H 1001000 48 
29 工 100 1001 49 
2A J 1001010 4A 
2B K 1001011 4B 
2C L 100 1100 4C 
2D M 1001101 4D 
2E N 1001110 4E 
2F o 1001111 4F 
30 P 1010000 50 
31 Q 1010001 51 
32 R 1010010 52 
33 s 1010011 53 
34 T 101 0100 54 
35 U 1010101 55 
36 V 1010110 56 
37 W 1010111 S 
38 X 1011000 58 
39 Y 1011001 59 
3A 2 101 1010 5A 
3B [ 101 1011 5B 
30 \ 101 1100 5C 
3D ] 1011101 45D 
3E a 1011110 5E 
3F L 101 1111 5F 


换 页 


数据 链 路 转 义 
设备 控制 1 
设备 控制 2 
设备 控制 3 
设备 控制 4 













传输 块 结束 


图 A-3 ”美国 信息 交换 标准 代码 (ASCII) 
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el 


110 0000 
110 0001 
110 0010 
110 0011 
110 0100 
110 0101 
1100110 
1100111 
110 1000 
110 1001 
110 1010 
110 1011 
110 1100 
110 1101 
110 1110 
110 1111 
111 0000 
111 0001 
111 0010 
111 0011 
111 0100 
1110101 
111 0110 
111 0111 
111 1000 
111 1001 
111 1010 
111 1011 
111 1100 
111 1101 
111 1110 
HIN 


取消 
介质 中 断 
替补 
换 码 (溢出 ) 
文件 分 隔 符 
分 组 符 
记录 分 离 符 
单元 分 隔 符 
空格 

删除 





000 
001 
010 
O11 
100 
101 
110 
111 


Ht Pep ARH 


中 央 处 理 单 元 ( CPU ) 


状态 位 (NzVC) 
BIA? (A) 
变 址 寄存 器 (X) 


程序 计数 器 (PC) 
栈 指针 (SP) 


指令 寄存 器 (IR) | 





图 A-4 Pep/9 计算 机 的 中 央 处 理 单元 
指示 符 
a) 非 一 元 指令 的 两 个 部 分 
指示 符 
b) 一 元 指令 


图 A-5 Pep/9 指令 格式 

















立即 数 0 立即 数 0 累加 器 A 
wmo | 1 i 变 址 寄存 


间接 b) 寻 址 a 字段 c) 寄存 器 r 字 自 
RARO 

栈 相对 间接 

栈 变 址 

栈 间 接 变 址 

a) 寻 址 aaa 字 段 


图 A-6 Pep/9 指令 指示 符 字段 
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: 


0000 0000 


0000 0001 
0000 0010 
0000 0011 


0000 0100 


0000 0101 


0001 001a 
0001 010a 
0001 Olla 
0001 100a 
0001 101a 
0001 110a 
0001 11la 
0010 000a 
0010 001a 


0010 010a 


间接 
Beet 


栈 相对 间接 


栈 变 址 
Bela eA 


STOP 
RET 
RETTR 
MOVSPA 
MOVFLGA 


MOVAFLG 


BR 
BRLE 
BRLT 
BREQ 
BRNE 
BRGE 
BRGT 
BRV 
BRC 


CALL 


000 i 
001 d 
010 n 
011 s 
100 sf 
110 SX 
mo 并 


停止 执行 

从 CALL 返 回 
从 陷阱 返回 
把 SP 传送 到 A 


把 NZVC 标 志 传 送 到 A(12..15) 


把 A(12..15) 传 送 到 NZVC 标 志 


无 条 件 分 支 
小 于 等 于 分 支 
小 于 分 支 
等 于 分 支 
不 等 于 分 支 

大 于 等 于 分 支 

大 于 分 支 
如 果 V 为 1， 则 分 支 
如 果 C 为 1， 则 分 支 
调用 子 例 程 


OprndSpec 


Mem[OprndSpec] 
Mem[Mem[OprndSpec]] 


Mem[SP+OprmdSpec] 


Mem[Mem[SP + OprndSpec]] 
Mem[SP+OprndSpec+X] 
| Mem[Mem[SP+OpmdSpec]+X] 
图 A-7 Pep/9 寻 址 方式 






Seer cceceae ca 





i,x 


图 A-8 Asmb5 层 的 Pep/9 指令 集 








pete 


Wt ”Pep/9 RH 
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‘00100lIn  NOPn 一 元 空 操作 陷阱 
0010 laaa NOP 非 一 元 空 操作 陷阱 i 
0011 0aaa DECI 十 进 制 输入 陷阱 d, n, s, sf, x, sx, sfx NZV 
0011 laaa DECO 十 进 制 输出 陷阱 i, d, n, s, sf, x, sx, sfx 
01000aaa HEXO 十 六 进 制 输出 陷阱 i, d, n, $, sf, x, Sx, sfx 
0100 laaa STRO 字符 串 输出 陷阱 d, n, s, sf, x 
01010aaa ADDSP 加 到 栈 指 针 (SP ) 上 i, d, n, s, sf, x, sx, sx NZVC 
0101 laaa SUBSP 从 栈 指针 (SP) 减 去 i, d, n, s, sf, x, sx, sfx NZVC 
0110 raaa ADDY 加 到 r 上 | bdn,s, st xsx, sfx NZVC 2 : 
Oll raaa SUBr 从 ! 减 去 bdms,stx ssie NZVC 
1000raaa NDE 与 : 按 位 AND idas six ssie NZ 
1001 raaa ORI 与 r 按 位 OR idn ssf x, sx, sf NZ 
1010 raaa CPWr 与 r 进 行 字 比 较 i, d, n, s, sf, x, sx, sfx NZVC 
1011 raaa CPBr Ejr (8.15 ) 进行 字 节 比较 i, d, n, s, sf, x, sx, sfx NZVC 
1100 raaa LDWr 从 主 存 加 载 字 到 r i, d, n, s, sf, x, sx, sfx NZ 
1101 raaa LDBr 从 主 存 加 载 字 节 到 r ( 8..15 ) i, d, n, s, sf, x, sx, sfx NZ 
1110 raaa STWr 从 r 存 储 字 到 主 存 d, n, $, sf, x, sx, sfx 
llllraaa STBr 从 r ( 8..15 ) 存储 字 节 到 主 存 d, n, s, sf, x, sx, sfx 


图 A-8 (#£) 





.ADDRSS 符号 的 地 址 
-ALIGN 填充 以 对 齐 内 存 边 界 
.RSCII ASCLL 字 节 字 符 串 
.BLOCK 零 字 节 块 
BURN 启动 ROM 烧 入 
-BYTE 一 个 字 节 值 
-END 汇编 器 标记 
- EQUATE 将 一 个 符号 等 同 于 一 个 常量 值 
.WORD 一 个 字 值 


图 A-9 Pep/9 汇编 语言 的 伪 操 作 
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FFF4 

FFF6 

FFF8 

FFFA FC16 

FFFC 

FFFE [EC52 | 

A-10 Pep/9 的 内 存 映 射 ， 阴 影 部 分 是 ROM 
指令 寄存 器 传送 语言 说 明 
STOP 停止 执行 
RET PC é MemlSP]; SP & SP + 2 
RETTR NZVC <— Mem[SP](4..7) ; A¢- Mem[SP + 1] ; X << Mem[SP + 3] ;PC — Mem[SP + 5] ; 
SP — Mem[SP + 7] 

MOVSPA ASP 


MOVFLGA A(8..11) —0, A(12..15) — NZVC 
MOVAFLG NZVC & A(12..15) 


NOTr reor;Ner<0,Z¢r=0 

NEGr rer;Ner<0,Zer=0,V & {overflow} 

ASLr Ce r(0) , r(0..14) + r(1..15) , (15) —O; Ner<0,Zer=0,V€ {overflow} 
ASRr Ce r(15) , r(1..15) e (0.14) ;Ner<0,Zer=0 


图 A-11 Pep/9 指令 的 RTL 描述 


指令 


ROLr 
RORY 
BR 
BRLE 
BRLT 
BREQ 
BRNE 
BRGE 
BRGT 
BRV 
BRC 
CALL 
NOPn 
NOP 
DECI 
DECO 
HEXO 
STRO 
ADDSP 
SUBSP 
ADDr 
SUBr 
ANDr 
ORr 


CPWr 
CPBr 
LDWr 
LDBr 
STWr 
STBr 


Trap 


WR Pep KRAH 


寄存 器 传送 语言 说 明 


Ce r(0) , r(0..14) er(1..15) , (15) — C 
Ce r(15) , (1.15) & r(0..14) , (0) — C 
PC <— Oprnd 

N=1vZ=1=PC€ Oprnd 

N = 1 = PC © Oprnd 

Z = 1 = PC & Oprnd 

Z =0= PC & Oprnd 

N = 0 = PC € Oprnd 
N=0AZ=0=> PC € Oprnd 

V=1= PC & Oprnd 

C=1 = PC Oprnd 

SP + SP — 2; Mem[SP] + PC ; PC & Oprnd 
陷阱 : 一 元 空 操作 

陷阱 : 非 一 空 无 操作 

陷阱 :Oprnd + {decimal input} 

BEBE {decimal output} — Oprnd 

BABE {hexadecimal output} — Oprnd 

ABE: {string output} + Oprnd 

SP & SP + Oprnd 

SP & SP — Oprnd 
rert+Opmnd;Ner<0,Zer=0,V€ {overflow} , C e {carry} 
rer—-Oprnd;Ner<0,Zer=0, Ve {overflow} , C {carry} 
reraAOpmd;Ner<0,Z¢r=0 
rervOpmd;Ner<0,Z¢r=0 


Ter-Opmd;NeT<0,Z<—T=0,V€ {overflow} , C — {carry}; NNV 
Te r(8..15) ~ byte Oprnd; Ne T<0,Z¢T=0,Ve0,Ce0 
r<Oprmd;Ner<0,Z¢r=0 

r(8..15) — byte Oprnd ; N + 0 , Z & r(8..15) =0 

Oprnd & r 

byte Oprnd & r(8..15) 


T <— Mem[FFF6] ; Mem[T -1 e IR(O..7) ; Mem[T ~ 3] — SP ; Mem[T ~ 5] — PC; 
MemI[T — 7] X ; Mem[T — 9] + A ; MemI[T — 10](4..7) — NZVC ; SP =T - 10; 
PC — Mem|[FFFE] 


图 A-11 (2) 
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图 A-13 Pep/9 CPU 的 数据 部 分 
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图 A-14 具有 双 字 节 数 据 总 线 的 Pep/9 CPU 


部 分 练习 参考 答案 


第 1 章 
2.(a) 11110， 不 包括 Khan 
3. (a) 
4. (a) 
(b) 31 
9. 43 EP 
12. 每 秒 32 位 
15. (a) 1936 位 (b) 152 个 字符 
21. 
Temp5 
F.Name F.Major F.State 
Ron Math OR 
Tempé 
S.Name S.Class S.Major S.State 
Beth Soph Hist TX 
Allison Soph Math AZ 


22.(a) select Sor where S.Name = Beth giving Temp 
project Temp over S.State giving Result 

第 2 章 

1.(a) 调用 了 4 次 





2. (a-1 ) (a-2 ) 
ai 
Call BC(4, 1) 
Call BC(3, 1) 


Call BC(2, 1) 
Call BC(1, 1) 
Return to BC(2, 1) 
Call BC(1, 0) 
Return to BC(2, 1) 
Return to BC(3, 1) 
Call BC(2, 0) 
Return to BC(3, 1) 
Return to BC(4, 1) 
Call BC(3, 0) 
Return to BC(4, 1) 
Return to main program 


(a-3 ) 被 调用 了 7 次 
(a-4) 最 多 有 5 个 栈 帧 


(a-5) 





第 3 章 
1. (a) 八进制 : 267, 270, 271, 272, 273, 274, 275, 276, 277, 300, 301 
(b) 三 进 制 : 2102, 2110, 2111, 2112, 2120, 2121, 2122, 2200, 2201, 2202, 2210 


YPRIBGER = 531 


(c) 二 进 制 : 10101, 10110, 10111, 11000, 11001, 11010, 11011, 11100, 11101, 11110, 11111 
(d) 五 进 制 : 2433, 2434, 2440, 2441, 2442, 2443, 2444, 3000, 3001, 3002 


3. (a) 18 (b) 6 (ej 11 (d) 8 (e) 31 (f) 85 
5.(a) 11001 (b) 10000 (c)1 (d) 1110 (e) 101 (f) 101001 
7.(a) 00 ~ 11 (bin), 0 ~ 3 (dec) (b) 000 ~ 111 (bin), 0 ~ 7 (dec) 
8.(a) 111 0100, C =0 (b) 001 0000, C= 1 

(c) 111 1110,C =1 (d) 000 0000, C=0 
11.(a) 7 x 8°+0 x 8 +1 x 8° +4 x 8'+6 x 8° 
13.(a) 011 0001 (b) 110 0101 

(c) 000 0000 (d) 100 0000 (e) 111 1111 

(f) 111 1110 (g) 100 0000 ~ 011 1111 (bin), -64 ~ 63 (dec) 
15.(a) 29 (b) -—43 (c)-4 (d)1 (e)-64 (f) -63 
17.(a) 011 1001, NZVC = 0000 (b) 000 0110, NZVC = 0001 

(c) 001 1011, NZVC = 0011 (d) 101 0110, NZVC = 1001 

(e) 100 0001, NZVC = 1011 (f) 111 0100, NZVC = 1000 


19.(a) 10 ~ 01 (bin) , -2 ~ 1 (dec) 
(b) 100 ~ 011 (bin) , -4 一 3(dec) 


20.(a) 010 1000, NZ = 00 (b) 000 0101, NZ = 00 (c) 110 1110, NZ = 10 
(d) 101 1111, NZ=10 (e) 100 0110, NZ = 10 (f£) 101 1010, NZ = 10 
(g) 101 0100 (h) 001 0101 


22.(a) 24 (dec) = 001 1000 (bin) 
ASL 001 1000 = 011 0000 (bin) = 48 (dec), NZVC = 0000 
ASR 001 1000 = 000 1100 (bin) = 12 (dec), NZC = 000 
(b) 37 (dec) = 010 0101 (bin) 
ASL 010 0101 = 100 1010 (bin) = —54 (dec), NZVC = 1010 
ASR 010 0101 = 001 0010 (bin) = 18 (dec), NZC = 001 
(c) -26 (dec) = 110 0110 (bin) 
ASL 110 0110 = 100 1100 (bin) = —52 (dec), NZVC = 1001 
ASR 110 0110 = 111 0011 (bin) = —13 (dec), NZC = 100 
(d) 1 (dec) = 000 0001 (bin) 
ASL 000 0001 = 000 0010 (bin) = 2 (dec), NZVC = 0000 
ASR 000 0001 = 000 0000 (bin) = 0 (dec), NZC = 011 
(e) 0 (dec) = 000 0000 (bin) 
ASL 000 0000 = 000 0000 (bin) = 0 (dec), NZVC = 0100 
ASR 000 0000 = 000 0000 (bin) = 0 (dec), NZC = 010 
(f) -1 (dec) = 111 1111 (bin) 
ASL 111 1111 = 111 1110 (bin) = -2 (dec), NZVC = 1001 
ASR 111 1111 = 111 1111 (bin) =—1 (dec), NZC = 101 
25.(a) C=1, ROL 010 1101 = 101 1011, C=0 
(b) C=0, ROL 010 1101 = 101 1010, C=0 
(c) C=1, ROR 010 1101 = 101 0110,C = 1 
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(d) C=0, ROR 010 1101 = 001 0110, C=1 
28. (a) 3AB7, 3AB8, 3AB9, 3ABA, 3ABB, 3ABC 
29.(a) 11,614 
30. (a) 68CF 
32. (a) 5D (hex) = 101 1101 (bin) = —35 (dec) 

(b) 2F (hex) = 010 1111 (bin) = 47 (dec) 

(c) 40 (hex) = 100 0000 (bin) = -256 (dec) 
34. (a) -27 (dec) = 110 0101 (bin) = 65 (hex) 

(b) 63 (dec) = 011 1111 (bin) = 3F (hex) 

(c) -1 (dec) = 111 1111 (bin) = 7F (hex) 

36. Have a nice day! 
38. 101 0000 1100001 111 1001 0100000 0100100 

011 0000 010 1110 011 1001 011 0010 


40. (a) D5 82 

43. (a) 八进制 数字 表示 3 位 。 

44. (a) 6.640625 (b) 0.046875 (c) 1.0 

46. (a) 1101.00101 (b) 0.000101 (c)0.1001100110011 ... 


50. (a) -12.5 (dec) =—1100.1 (bin), 存储 为 1 110 1001 
51. (a) 0.90625 
53. (a) 1.0 x 2° 


第 4 章 
1.(a) 65 536 字 节 (b) 32 768 字 (c) 524 288 位 
(d) 92 位 (e) 大 5699 fë 
3. 对 指令 6AF82C 对 指令 D623D0 
(a) opcode = 0110 (a) opcode = 1101 
(b) 与 寄存 器 z 相 加 (b) 从 内 存 装 和 人 一 个 字 节 到 寄存 器 r 
(c) r=1 (c) r=0 
(d) 变 址 寄存 器 X (a) 累加 器 A 
(e) aaa = 010 (e) aaa= 110 
(f) 间接 寻 址 (£) 栈 变 址 寻 址 
(g) OprndSpec = F82C (g) OprndSpec = 23D0 
5. A x Mem[0A3F] Mem[0A41] 










原始 内 容 


(a) Cl= 累加 器 字 装 人 FF00 FE20 FF00 103D 
(b) Di= 累加 器 字 节 装 和 人 19FF FE20 FF00 103D 
(c) D9= 变 址 寄存 器 字 节 装 人 19AC FE10 FF00 103D 
(d) Fl= 累加 器 字 节 存储 19AC FE20 FF00 AC3D 
(e) E9= 变 址 寄存 器 字 存 储 19AC FE20 FE20 103D 
(£) 79= 从 变 址 寄存 器 减 去 19AC EDE3 FF00 103D 


(g) 71= 从 累加 器 减 去 
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( 续 ) 
A X Mem[0A3F] Mem[0A41] 
(h) 91=OR 累加 器 FFAC FE20 FF00 103D 
(i) 07= 反 转 变 址 寄存 器 19AC 01DF FF00 103D 
9.(a) M 
第 5 章 
1. (a)ORX OxEF2A,n (b) MOVSPA (c)LDBA 0x003D,sfx 
3. (a) 0A (b)33 00 OF (c)1A 01 E6 
5. (a)42 65 61 72 00 (b) F8 (c)03 16 
7, mug 
10. -57 
72 
0048 
Hi 


12.(a) 目标 代码 为 : 


38 00 6D DO 00 OA F1 FC 16 38 6D 6D DO 00 OA F1 
FC 16 DO 00 26 F1 FC 16 00 zz 


输出 为 : 


13. 目标 代码 为 : 


12 00 05 00 09 39 00 03 00 zz 


符号 here 的 值 为 0003 (hex)， 符 号 there 的 值 为 0005 (hex) 

15. 符号 this 的 值 为 0000 (hex)， 输 出 是 4100。 答 出 来 自 十 六 进 制 输出 指令 ， 该 指令 输出 了 自己 的 指 
令 指 示 符 以 及 操作 数 指示 符 的 第 一 个 字 节 。 

18. 编译 器 用 它 的 符号 表 来 存储 每 个 变量 的 类 型 ， 每 当 遇 到 表达 式 或 赋值 语句 时 ， 编 译 器 就 会 查询 符 
号 表 ， 验 证 类 型 是 否 兼 容 。 

第 6 章 

3. 因为 无 论 控制 来 自 0009 的 STWA 还 是 循环 底部 的 BR, j 的 当前 值 都 会 放 在 累加 器 中 。 在 循环 底部 

的 BR 之前， 累加 器 用 于 j 的 增加 ， 因 此 当 CPWA 执行 时 , j 的 当前 值 仍 然 会 在 累加 器 中 。 


6. 
pc [OIF] raap pc [0005] mp[ | 
SP | FB8F FB8F SP | FB8D FB8F 
(a) 执行 第 二 条 CALL 之 前 (b) 执行 第 二 条 CALL 之 后 


8. 分 支 地 址 计算 如 下 : 
Oprnd = Mem[OprndSpec + X] 
= Mem[0013 + 8] 
= Mem[001B] 
= 4900 
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从 程序 代码 中 无 法 看 出 4900 处 的 内 容 是 什么 ， 假 设 它们 为 全 0， BAS - 诺 依 曼 周 期 就 会 盲目 地 
把 地 址 4900 处 的 00 HFA STOP 指令 。 


第 7 章 


1. 计算 机 科学 的 基本 问题 是 : 什么 能 够 自动 化 ? 


3.(a) 
<identifier> 
= <identifier> <digit> 
= <identifier> 3 
=> <identifier> <digit> 3 
= <identifier> 23 
= <identifier> <digit> 23 
= <identifier> 123 
= <identifier> <letter> 123 
> <identifier> c123 
= <identifier> <letter> c123 
= <identifier> bc123 
=> <letter> bc123 


=> abc123 
4. (a) 


I FM Rule 1 
=>-M Rule 3 


=>-d Rule 6 
5.(a) 


A SabC Rule 2 


so saan 


Rule 3 
Rule 9 
Rule 3 
Rule 8 
Rule 3 
Rule 7 
Rule 2 
Rule 6 
Rule 2 
Rule 5 
Rule 1 
Rule 4 


<identifier> 
<identifier> <digit> 
<identifier> <digit> | 
<identifier> <digit> | 
<identifier> <letter> | 
<identifier> <letter> l 
me | 


a 


UDR IBAER 


7. (a) <statement> 


<compound-statement> 





{ <declaration-list> <statement-list> } 
€ . 
<statement-list> <statement> 
<statement> <expression-statement> 
<expression> i 


<selection-statement> 


S2 
if ( <expression> ) <statement> 
cl <expression-statement> 
<expression> ; 
SI 
8. (a) <statement> 


| 


<expression-statement> 


<expression> i 


ae ee 


<identifier> = <expression> 


alpha <relational-expression> 


<additive-expression> 


<multiplicative-expression> 


<unary-expression> 


<primary-expression> 


<constant> 
1 


11. 该 机 器 是 确定 性 的 ， 没 有 不 可 访问 的 状态 。 
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13. (a) 

一 (全 

第 8 章 

2.(a) 36 (hex)， 是 第 30 个 字 节 中 6 对 应 的 ASCII 码 ，6C 

4.(a) 31 (hex)， 被 中 断 指令 的 指令 指示 符 

5.(a) 39 (hex)， 被 中 断 指令 的 指令 指示 符 

6.(a) 49 (hex)， 被 中 断 指令 的 指令 指示 符 

7.(a) 0003 (hex),ASCII 字 符 3 的 数值 。(b)0007 (hex), ASCII 字符 7 的 数值 。(c)0000(hex),init 的 值 ， 

起 始 状 态 。 
8. 提示 : 第 一 个 字符 输入 是 ASCII 的 连接 符 字 符 。 
9.(a) 0025 (hex)， 即 37 (dec). 
(b) 0025 (hex)， 没 有 取 反 ， 因 为 它 已 经 是 非 负 的 了 。 
(c) FF78 的 CALL 是 用 于 写 100 的 位 置 。 累 加 器 的 值 还 是 0025 (hex)， 即 37 (dec)， 因 为 37 mod 
100 就 是 37。 

18.(a) 算法 不 能 保证 互 斥 。 假 设 Pl 和 P2 都 在 它们 各 自 的 其 余部 分 中 ，enterl 和 enter2 均 为 假 。P1 
可 以 执行 它 的 while 循环 测试 ， 然 后 被 中 断 ， 此 后 P2 会 执行 它 的 while 循环 测试 。 然 后 它们 可 
能 把 各 自 的 enter 变量 赋值 为 真 ， 同 时 进入 临界 区 。 

20.(a) S=0, 没有 被 阻塞 的 进程 。 

22. (a) 算法 能 保证 互 斥 。 如 果 完 全 删除 信号 量 t， 就 可 以 得 到 图 8-20 的 算法 ， 该 算法 能 够 保证 互 斥 ， 
而 不 用 考虑 算法 中 存在 的 任何 其 他 代码 。 

24.(a) 不 再 能 保证 互 斥 。 能 找到 一 个 序列 使 得 Pl 和 P2 同时 进入 它们 的 临界 区 吗 ? 不 过 ， 不 会 出 现 死 锁 。 


25, 
at 
(a) 包含 死 锁 循 环 (b) 不 包含 循环 ， 所 以 没有 死 锁 
第 9 章 


2.(a) 一 个 边界 寄存 器 就 足够 了 ， 因 为 每 次 只 能 有 一 个 进程 在 执行 。 如 果 用 户 进程 试图 访问 逻辑 地 址 
空间 外 的 内 存 位 置 ， 硬 件 必须 中 断 页 表 的 访问 ， 因 为 该 页 不 在 主 存 中 。 操 作 系 统 必须 跟踪 每 个 
进程 的 边界 值 。 

4.(a) 2° 或 4098 字 节 。 

6. 那些 脏 位 值 为 N 的 页 ， 也 就 是 帧 2、5 和 6 中 的 页 。 

8. 一 个 分 配 了 三 帧 的 作业 的 页 访问 序列 的 起 始 是 1, 2, 3, 1, 4, 2, …， 对 这 个 序列 FIFO 有 四 次 缺 页 ， 

LRU 有 五 次 缺 页 。 能 继续 完成 这 个 序列 使 得 FIFO 在 这 个 特殊 的 情况 下 更 好 吗 ? 

10. 产生 五 次 缺 页 ， 相 比 之 下 FIFO 是 七 次 ，LRU 是 六 次 。 可 以 跟踪 该 算法 验证 这 张 图 。 

11.(a) 提示 : 最 糟 的 情况 是 读 / 写 头 刚 好 经 过 块 的 起 始 位 置 。 因 此 ， 磁盘 必须 完整 转 一 圈 。 可 以 从 
RPM 数 算出 这 个 时 间 。 

12.(a) 四 个 数据 位 (b) 一 个 奇偶 位 

16. (a) 错误 发 生 在 位 置 2。 纠 正 后 的 码 字 是 1101 1010 1001。 
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#108 
1. (a) 
ytl 
= (HEME) 
x+(x+x") 
= (eA) 
(xtx)+x' 
= (EFE) 
xx" 


= 《互补 律 》 


4. 要 证 明 a+b 的 补 是 &… b'， 必 须 证 明 
(a+b) +(a'+ b')=0 和 (a+b) + (a'* b’) =1 
证 明 的 第 一 部 分 如 下 : 
(a+b) (a* b) 
= 《交换 律 》 
(a'- b’) - (a+b) 
《分 配 律 》 
(a’'+ b") + a+(a'+b') +b 
《交换 律 ， 结 合 律 》 
b’+ (a+ a'j+a's (b+ b+) 
《互补 律 》 
b'+ 0+a'- 0 
(EIEH, x + 0=0) 
0+0 
CEF) 


ll 


ll 


il 


8. (a) 








a a b cj|x 
i) > 0.0 0|0 
本 00 rii 
x=a+b+c © toja 
ailt 
10 0/1 
i ali 
11 041 
ý i ila 
9. (a) 任何 集合 和 空 集 的 并 都 是 它 自 己 。 


10. (a) 


| | | B @ 
@) © © © z z 


(1) (x+y) (2) z (3) (x+y) +z (4) x (5)y+z (6) x + (y +z) 
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13. (a) 


x 
0 
0 
0 
0 
A 
A 
A 
A 
B 
B 
B 
B 
1 
1 
1 
1 





15.(a) a >o >o >o e yy 


(c) a 
a'b + ab' 
b 


19. (a) y (a, b, c) =a'be + ab'c' 
20. (a) y (a, b, c)}=(a+b+c)(a+b+c')(a+b'+c)(a'+b+c')(a'+b'+c)(a'+b'+c") 





21. (a) ab+a'b (d) a'b+ab 
a b |2i(a) 21(d) 
0 oO 1 0 
0 1 0 1 
1 0 0 0 
1 1 1 1 





22.(a)a (b) a 
b b 
a a’ 
b' b 


23. (b) (a'+b)(a+b’) 





a 
0 
0 
1 
1 


- O m © 
-oom 
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24.(b) a 
b 
a 
5 
25.(a) a 
i) 
a’ 
b 


27.(a) 2(0,3) (d) 21,3) 
28.(b) TI(1,2) 
29.(a) x=a'c 


a 
c 
1 


30. (a) x =(a’ Xo 


a’ 


0 


Cc 
0 


31.(a) x(a, b,c)=ac+b'c’ 

32. (a) x(a, b, c) = T1(1, 2, 3, 6) =(a+e')(b' +c) 

33.(a) x(a, b, c, d) = be'+a'b'c + b'cd' 

34. (a) TI(0, 1, 6, 7, 8, 9, 11, 14, 15), x(a, b, c, d) = (b + c)(b’ +c’) 
(a'+c'+d') or x(a, b, c, d)=(b + c)(b'+c')(a'+b+d') 

35.(a) x(a, b,c)=a'b'+ ab 

36. (a) x(a, b, c, d) = bce + bd 

38. (a) 控制 线 作 为 使 能 ， 当 控制 线 为 0 时， 数据 会 不 改变 地 通过 ; 当 控制 线 为 1 时 ， 会 禁止 输出 ， 输 
出 被 设置 为 1， 无 论 数据 输入 是 什么 。 
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a 
5 
Sj 一 | uj an 
ajajaja 
二 S ee 3 oe S a S 
a nA a a 
oj 一 | aye 己 | 一 | arn Sj 一 | a| a oj 一 | ayo 
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42. (a) 





46.(a) Cin 
$ Sum 
B 
Carry 


(b) 最 大 的 三 个 门 延迟 
47.(b) tim: 如 果 看 一 下 图 10-52， 全 加 器 有 3 个 门 延迟 ， 半 加 器 有 一 个 门 延 迟 ， 所 以 整个 的 门 延迟 
是 10。 不 过 ， 其 实 比 这 个 数值 小 。 
第 11 章 
1. 如 果 有 偶数 个 反 相 器 ， 网 络 会 稳定 。 
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3 A BE DERM SQQ 
f@ 0 0 TFT 1 0 1 DB 0 1 
(b) 9 0 0 1 





13. (a) DA=A XI+A X1+A B X2+B X1 X2 
DB=B X1+B X1 X2+AB X1 
Y=A X2+A X1 X2 


15. (a) JA=BCX+BCX KA=B C X+B CX 
JB=C X+CX KB=C X+CX 
Ji KC=1 

$128 


5. 提示 : (a) 使 用 160 亿 GiB EF 16 x 1024' 字 节 ， 芯 片面 积 是 4.3 x 4.3 平方 米 ， 但 是 必须 给 出 计算 
过 程 。(b) 是 的 , 但 是 必须 给 出 解释 。 
12. (a) lw $t0,20($s6) # Register $t0 gets b[5] 
add $t0,$s5,$t0 # Register St0 gets g + b[5] 
sw $t0,16($s4) # a[2] gets g + b[5] 
(b) 100011 10110 01000 0000000000010100 
000000 10101 01000 01000 00000 100000 
101011 10100 01000 0000000000010000 
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Absorption property (吸收 率 )，583， 参 见 Boolean 
algebra 
Abstract data types (抽象 数据 类 型 ，ADT)，549- 
550, 626 
Abstraction (抽象 )，4-11 
in art (艺术 中 的 抽象 )，5-6 
assembly level of, compiling to (汇编 屋 ， 编 译 ) 
branching instructions and flow of control (分 
支 指令 和 控制 流 )，294-310 
dynamic memory alloction (动态 内 存 分 配 )， 


356-377 
function calls and parameters (函数 调用 和 参 
数 )，310-336 


indexed addressing and arrays ( 变 址 寻 址 和 
数组 )，336-356 
stack addressing and local variables( 栈 寻 址 
和 局 部 变量 )，288-294 
in computer system (计算 机 系统 中 的 抽象 )， 
10-11, 774 
of data (数据 的 抽象 )，357 
definition of (抽象 的 定义 )，4 
in documents (文档 中 的 抽象 )，7-8 
graphic representations of( 图 形 表 示 中 的 抽象 ), 
4-5 
hierarchy diagrams (层次 结构 图 )，5 
level diagrams (层次 图 )，5 
nesting diagrams (ERI), 5 
at Level LG1 (LG1 层 的 抽象 )，626 
in machines (机 器 中 的 抽象 )，9 
in organizations (组 织 中 的 抽象 )，8-9 
of program control (程序 控制 的 抽象 )，357 
activation record (活跃 记录 )， 参 见 stack frame 
actual parameter (SEZ), 75 
add immediate instruction (加 立即 数 指令 )，707-709 


Add instruction (加 法 指令 )，197-198 
ADDA instruction, Pep/9 ( ADDA 指令 ，Pep/9 ), 
723-725 
Adder (加 法 器 )，613-615 
full (全 加 器 )，613 
half ( 半 加 器 )，613 
ripple-carry( 行 波 进位 加 法 器 )，614-615 
Adder/subtracter (加 法 器 /减法 器 )，615-617 
Addition (加 法 ) 
16-bit with two 8-bit (用 8 位 实现 16 位 加 
法 )，622-623 
signed (有 符号 加 法 )，622-624 
unsigned (无 符号 加 法 )，124-125 
Address decoding (地 址 译 码 )，674-680 
Address lines (地 址 线 )，669-670 
Address operator (地 址 运算 符 )，61 
Addressing modes,，( 寻 址 方式 ) 745-749 
MIPS, 745-749 
base (HE Fit), 745, 752, 760 
immediate (立即 数 寻 址 )，745，747 
PC-relative (PC 相对 寻 址 )，745，747-748 
pseudodirect ( 伪 直 接 寻 址 )，745，748-749 
register (寄存 器 寻 址 )，745 ，747 
Pep/9，702 
direct (直接 寻 址 )，247-248，486，703-704 
immediate (立即 数 寻 址 )，247-248，250， 
487，707-708 
indexed ( 变 址 寻 址 )，339-340，353 ，752 
indirect (间接 寻 址 )，362，486，709-712 
letters for (表示 寻 址 方式 的 字母 )，235 
problem of computation (地 址 计算 的 问题 )， 
248 
stack- deferred indexed ( 栈 间接 变 址 寻 址 )， 
349-350, 376-377 
stack-indexed ( 栈 变 址 寻 址 )，343 
stack-relative ( 栈 相 对 寻 址 )，289-292，486 
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stack-relative deferred ( 栈 相 对 间接 寻 址 )， 
328, 332, 366 
trap assertion ( 陷阱 断言 )，480-482 
trap operand computation (陷阱 操作 数 计算 )、 
483-486 
.ADDRSS pseudo-op (.ADDRSS fh ## fF), 238, 
353 
ADDSP instruction (ADDSP 指令 )，289 
Adjacent minterms ( 相 邻 极 小 项 )，599-600 
Advanced Micro Devices (AMD 公司 )，39 
Advanced RISC Machines (ARM), 39 
Aiken, Howard H., 118 
Algol 60, 308 
Algorithm (435), 17-18 
Alignment patterns, QR code (校准 图 形 , QR #3), 
29-30 
Allocation techniques (分 配 技术 )，552-554 
Alphabet (字符 表 )，393 ，395 
closure of (字符 表 的 闭 包 )，394 
.ALIGN pseudo-op (.ALIGN 伪 操 作 )，238，723 
ALU, 617-626 
American Standard Codard Code for Information 
Interchange (美国 信息 交换 标准 代码 )， 
参见 ASCII 
AND gate (AND 门 )，586-587 
and instructions (与 指令 )，199-200 
AND-OR circuit (AND-OR 电路 )，594-597 
App7，10-11 
Application programs，at Level App7 (应 用 程序 ， 
APP7 Jz), 11 
Applications software (应 用 软件 )，18-19 
Architecture，x86 (体系 结构 ，x86 )，219-220 
Arithmetic infix expression (R PARER), 
401 
Arithmetic operators (算术 运算 符 )，139-141 
Arithmetic Logic Unit (算术 逻辑 单元 )， 参 见 
ALU 
Arithmetic shift left REH), IL ASL 
Arithmetic shift right (ARAK), AJIL ASR 
Arrays (34H), 70-72, 337, ÆJ. Parameter 
global (全 局 数组 )，337-340 
local ( 局 部 数组 )，341-344 
MIPS (MIPS 数组 )，753 
Art, abstraction in (艺术 中 的 抽象 )，5-6 


ASCII, 23 
characters (ff), 146-149 
.ASCII peeudo-op (.ASCII 伪 操 作 )，238-240 
ASL operation (ASL 运算 )，139-140 
ASLR instruction (ASLr 指令 )，274-275 
Asmb5 (Asmb5 层 )，10 
assignment statement at (赋值 语句 )，270 
boolean types at (布尔 类 型 )，333-335 
call-by-reference parameters ( 传 引用 调用 参数 ) 
with global variables at (用 全 局 变量 的 )，324- 
326 
with local variables at (用 局 部 变量 的 )，329- 
330 
call-by-value parameters ( 传 值 调用 参数 ) 
with global variables at (用 全 局 变量 的 )，313- 


317 
with local variables at (用 局 部 变量 的 )，317- 
320 


do loop at (do 循环 )，302-303 
for loop at (for 循环 )，304 
function call at ( KOJ). 310-313 
non-void (4F 45), 320-323 
global arrays at (全 局 数组 )，337-338 
global pointers at (全 局 指针 )，357-363，361 
global structures at (全 局 结构 )，368-370 
if statement at (if J), 296-297 
if/else statement at (if/else if] ), 298-299 
increment statement at ( 增 量 语句 )，270 
linked data structures at ( 链 式 数据 结构 )，372- 
377 
local arrays at (局 部 数组 )，341-342 
local pointers at (局 部 指针 )，363-367 
parameter arrays at (参数 数组 )，345-347 
procedure call at (过 程 调用 )，311 
switch statement at (switch 语句 )，351-352 
types of statements at (语句 类 型 )，234 
while loop at (while #34), 300-301 
ASR 
instruction (ASR ##@), 712-713 
operation (ASR 运算 )，139-141 
ASRr instruction (ASRr #4), 274-275, 728 
Assemler (汇编 器 )，234-246 
cross(〈 交 叉 汇 编 器 )，246 
instruction mnemonics (指令 助 记 符 )，234-238 


nonunique nature of inverse mapping of ( i 映 
射 的 非 唯一 性 )，255 
one-to-one mapping of (一 对 一 映射 )，255 
pseudo-operation ( 伪 操 作 )，238 
resident ( 常 驻 汇编 器 )，246 
using Pep/9 (Pep/9 的 汇编 器 )，244-246 
assembly language (汇编 语言 ) 
assembler (汇编 器)，234-246 
cross (交叉 汇编 器 ) 246 
instruction mnemonics (指令 助 记 符 )，234- 
238 
pseudo-operation ( 伪 操作 )，238 
using Pep/9 (Pep/9 的 汇编 器 )，244-246 
comments (注释 )，238 
DECI, DECO and BR instruction ( DECI, 
DECO 和 BR 484), 248-251 
Disassembler (JZC fatt), 255-257 
HEXO instruction (HEXO 44), 252-255 
immediate addressing (立即 数 寻 址 )，247-248 
at Level Asmb5 (Asmbs 层 )，10 
line-oriented nature of (面向 行 的 本 质 )，238 
program (程序 )，305 
STRO instruction (STRO 指令 )，251-252 
Symbols (符号 )，257 
program with ( 带 符号 的 程序 )，258-260 
von Neumann illustration (13 - 诺 依 曼 示 例 )， 
260-261 
translating from Level HOL6 (从 HOL6 层 翻译 )， 
262-279 
constants and EQUATE (常数 和 EQUATE), 
275-279 
global variables and assignment statement (全 
局 变量 和 赋值 语句 )，267-271 
pep/9 symbol tracer ( Pep/9 符号 跟踪 器 )， 
273-274 
placement of instruction and data (指令 与 数 
据 的 放置 )，279 
printf () function (printf() X), 263-265 
shift and rotate instruction (循环 移 位 指令 )， 
274-275 
type compatibility (类 型 兼容 性 )，271-273 
variables and types (变量 和 类 型 )，266 
assembly line analogy (装配 线 的 比喻 )，761-762 
Assignment operator (赋值 操作 )，61 
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Assignment statement (赋值 语句 )，59-62，267- 
271, 273 

Associative law (结合 律 ) 581, 4 JL Boolean 
algebra 

Asynchronous interrupt (异步 中 断 )，$02-S03 

Atanasoff, John V., 118 

attributes, definition of (定义 中 的 属性 含义 )，42 
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backslash prefix( 反 斜 杠 前 缀 )，239-240 
Backuns Naur Form ( 巴 科斯 范式 )， 参 见 BNF 
Bandwidth (带宽 ) 
of channel (通道 的 带宽 )，26 
equation (带宽 公式 )，27 
base addressing, format for ( 基 址 寻 址 的 格式 )， 
747 
base conversions (基数 转换 ) 
hexadecimal representation (十 六 进 制 表 示 )， 
143-146 
two’s complement binary representation ( — 进 
制 补 码 表示 )，130-131 
unsigned binary representation (无 符号 二 进 制 
表示 )，121-123 
Base register ( 基 址 寄存 器 )，535， 参 见 Register 
basis, definition of (基础 的 定义 )，82 
Belady’s anomaly (Belady 异常 )，548 
Best-fit algorithm (最 优 适 配 算法 )，537-539 
bidirectional buses〈 双 向 总 线 )，667-668 
big-endian order (大 端 序 )，204-206 
binary addition rules〈 二 进 制 加 法 规则 )，124 
Binary decoder (— HEI VERSA), 611-612 
binary digit (二 进 制 数 字 )，119， 参 见 bit 
binary fractions (二 进 制 小 数 )，154-156 
binary prefixes (二 进 制 前 级 )，24-25 
binary representation (二 进 制 表 示 ) 
two’s complement (二 进 制 补 码 )，125-136 
base conversions (基数 转换 )，130-131 
negative and zero bits (负数 和 零 位 )，135- 
136 
number line ( 数 轴 )，131-133 
overflow bit( 洲 出 位 )，133-135 
two’s complement range (二 进 制 补 码 范 围 )， 
128-129 
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unsigned (无 符号 )，118-125 
base conversions (基数 转换 )，121-123 
binary storage (二 进 制 存储 )，118-119 
carry bit (进位 位 )，125 
integers (整数 )，119-121 
range for unsigned integers (无 符号 整数 的 
范围 )，123-124 
unsigned addition (无 符号 加 法 )，124-125 
binary storage, unsigned binary representation (— 
进 制 存储 ， 无 符号 二 进 制 表示 )，118-119 
binary to decimal conversion, two’s complement 
binary representation (二 进 制 转 十 进 制 ， 
二 进 制 补 码 表示 )，130-131 
binomial coefficient function (二 项 式 系数 函数 )， 
89-94 
Bit (位 )，119 
Carry (进位 )，125 
definition of (位 的 定义 )，22 
hidden (隐藏 位 )，158-159 
least significant (最 低 有 效 位 )，121 
most significant (最 高 有 效 位 )，125 
negative (负数 位 )，135-136 
overflow (Yt fiz), 133-135 
zero ($z), 135-136 
bit depth (位 深 )，33 
bit-interleaved parity (位 交叉 奇偶 校 验 )，567-568 
black and white images (黑白 图 像 )，32-34 
accuracy of (精确 度 )，33 
binary storage (二 进 制 存储 )，33-34 
number of pixels, increasing (增加 像素 数量 )， 
33 
black box ( 黑 盒 )，579 
block-interleaved distributed parity ( 块 交 叉 分 布 


奇偶 校 验 )，569 

block-interleaved parity ( 块 交叉 奇偶 校 验 )，568- 
569 

.BLOCK pseudo-op (.BLOCK 伪 操 作 )，238，241- 
242, 292 

BNF, 405 


Bohm, Corrado, 308-309 

Boolean algebra (布尔 代数 )，579-588，580-581 
absorption property (吸收 属性 )，583 
associative law (结合 律 )，581 
axiom (定理 )，583 


complement (互补 律 )，585 
consensus theorem (一 致 性 定理 )，583 
DE Morgan’s law ( 德 ， 摩根 定律 )，583-584 
distributive law (分 配 律 )，581 
duality (对 偶 性 )，581 
expressions and logic diagrams (表达 式 与 逻辑 
KI), 589-591 
idempotent property (EE), 582-583 
theorems (7 #1), 582-583 
and truth tables ( 真 值 表 )，591-593 
zero theorem (JCEM), 583 
Boolean expression (布尔 表达 式 ) 
and logic diagram (和 逻辑 图 )，589-591 
and truth table (和 真 值 表 )，591-593 
Boolean operator (布尔 运算 符 )，66 
Boolean type (布尔 类 型 )，333-336 
Bound register (边界 寄存 器 )，535，762， 参 见 
Register 
BR instruction (BR 指令 )，248-251 
Brahe, Tycho, 168 
BRC instruction (BRC ##4), 295 
BREQ instruction (BREQ #84), 295 
BRGE instruction (BRGE #94), 295 
BRGT instruction (BRGT #4), 295 
BRLE instruction (BRLE 指令 )，295 
BRLT instruction (BRLT 指令 )，295 
BRNE instruction (BRNE 指令 )，295 
BRV instruction (BRV 指令 )，295 
bugs, von Neumann (75 > 诺 依 曼 漏 洞 )，214 
.BURN instruction (.BURN 伪 操 作 )，238，471 
Bus (总 线 )，667-669 
Bidirectional (双向 的 )，667-668 
Protocols (协议 )，705 
tri-state buffers (三 态 缓冲 器 )，668-669 
unidirectional ( 单 向 的 )，667 
width (总 线 宽度 )，717-722 
wired-or property ( 线 -OR 属性 )，668 
byte (47), 119, 186 
definition of ( 字 节 定义 )，23 
compiler ( 编译 器 )，262-266 
compiler, optimizing (优化 编译 器 )，298 
memory model, heap (内 存 模型 ， 堆 )，363 
instructions (指令 ) 
load (4A), 202-203 


store ( FFfif), 202-203 
.BYTE pseudo-op (.BYTE HRE), 238, 242-244 
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C bit (C 位 )，134-135，617，694-695 

C compiler (C 编译 器 )，56-57 

in Microsoft’s Visual Studio (微软 Visual Studio 
中 的 C 编译 器 )，354 

C language (C if), 55-108 

Alphabet (C 字符 表 )，393 

context-sensitivity of (C 的 上 下 文 相关 性 )， 


407-408 
dynamic memory allocation (动态 内 存 分 配 )， 
102-108 


flow of control (控制 流 )，65-72 

functions (KU), 72-81 

identifiers, grammar for (C 标 识 符 的 语法 )， 
396-398 

recursion (递归 )，81-100 

small subset of (C 语言 的 一 小 部 分 )，402-407 

variables (变量 )，56-65 

C memory model (C 内 存 模型 )，57-59 

dynamically allocated variables (动态 分 配 变 
量 )，58 


function call (函数 调用 )，58 
function return (函数 返回 )，58 
global variables (全 局 变量 )，58 
local variables (局 部 变量 )，58 
push and pop operations (入 栈 和 出 栈 操作 )，58 
cache hit (高 速 缓存 命中 )，730 
Cache memories (高 速 缓冲 存储 器 )，729-738 
direct-mapped (直接 映射 )，732-734 
fully-associative, Exercise12.10 (47 40K, 4& 
习 12.10), 777 
locality of reference (引用 局 部 性 )，730 
MIPS, 755-757 
set-associative (HHHK), 734-736 
write policies (SRI), 736-737 
cache miss (高 速 缓存 缺失 )，730 
CALL instruction (CALL 指令 )，312-313 
Call-by-reference parameter ( 传 引 用 参数 )，76- 
81, ÁJ Parameter 
with global variables ( 带 全 局 变量 的 )，323-328 
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with local variables ( 带 局 部 变量 的 )，329-332 
Call-by-value parameter ( 传 值 参 数 )，72-75， 参 
见 Parameter 
with global variables ( 带 全 局 变量 的 )，314-318 
with local variables ( 带 局 部 变量 的 )，317-320 
calling protocol (调用 协议 )，360-361 
Canonical expression (范式 )，$98-599 
Carry bit (进位 位 )，125， 参 见 C bit 
Central Processing Unit ( CPU， 中央 处 理 单元 )， 
12-13, 185-186 
control section (控制 部 分 )，713-716 
data section (数据 部 分 )，692-696 
MIPS, 755-760 
Pep/9, 692-696 
Channels (通道 ) 
bandwidth of (通道 的 带宽 )，26 
definition of (通道 的 定义 )，26，40 
character constants (字符 常量 )，247 
character count indicator, QR code (字符 计数 指 
Ate, QR #4), 31 
character input program, von Neumann machines 
(字符 输入 程序 ， 汉 诺 依 曼 机 器 )，214- 
216 
character output program, von Neumann machines 
(字符 输出 程序 ， 汉 “' 诺 依 曼 机 器 )，208- 
214 
Character representation (字符 表示 ) 
ASCII characters (ASCII 字符 )，146-149 
Unicode characters (Unicode #47), 149-153 
Characteristic table (特征 表 ) 
for D flip-flop (D 触发 器 )，653 
excitation tables versus (激励 表 与 特征 表 )，650 
for JK flip-flop (JK 触发 器 )，651 
for SR flip-flop (SR 触发 器 )，647-648 
CISC, 39 
versus RISC (与 RISC), 739-741 
clock period (时钟 周期 )，641-642 
clock pulse (时 钟 脉冲 )，641-642 
Clocked SR flip-flop ( 钟 控 SR 触发 器 )，641-643 
block diagram of ( 方 框图 )，642 
implementation of (实现 )，642 
timing diagram of (时 序 图 )，643 
Closure of an alphabet (字母 表 的 闭 包 )，394 
Code (编码 )，119 
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Distance ( 编码 距离 )，557 
File (代码 文件 )，56 
Generation (代码 生成 )，406，435-456 
language translator (imi Mids), 435-455 
parser characteristics (语义 分 析 器 特性 )，455- 
456 
generator (代码 生成 器 )，392, 435-455 
point ( 码 位 )，149-150 
requirements (编码 要 求 )，556-559 
word (编码 字 )，556 
color depth ( 色 深 )，36 
color images (彩色 图 像 )，34-38 
color pixels (彩色 像素 )，35-38 
cone cell sensitivity ( 锥 形 细 胞 敏感 度 )，35 
wavelength of light, in visible spectrum ( 可 见 
光谱 中 的 光波 长 )，35 
Combinational circuit (组 合 电路 )，578-579 
combinational analysis (组 合 分 析 )，588-597 
Boolean expressions and logic diagrams ( fi 
尔 表 达 式 和 逻辑 网 )，589-591 
truth tables and Boolean expressions ( HH% 
和 布尔 表达 式 )，591-593 
two-level circuits (两 级 电路 )，593-595 
ubiquitous NAND (无 处 不 在 的 NAND)， 
595-597 
combinational design (组 合 设计 )，597-609 
canonical expressions (范式 )，598-599 
don't-care conditions (无 关 条 件 )，608-609 
dual Karnaugh maps (对 偶 卡 诺 图 )，607-608 
four-variable Karnaugh maps (四 变量 卡 诺 
图 )，604-607 
three-variable Karnaugh maps (三 变量 卡 诺 
图 )，599-604 
combinational devices (组 合 设备 )，609-626 
abstraction at Level LG1 (LG1 层 抽 象 )，626 
adder (加 法 器 )，613-615 
adder/ subtracter (加 法 器 /减法 器 )，615-617 
arithmetic logic unit (算术 逻辑 单元 )，617- 
626 
binary decoder (二 进 制 译 码 器 )，611-612 
demultiplexer (多 路 分 配 咒 )，612-613 
multiplexer ( 复 用 器 )，610-611 
viewpoints (视角 )，609-610 
logic gates (逻辑 门 )，$81-588 


alternate representations (其 他 表达 方式 )， 
587-588 
Boolean algebra (布尔 代数 )，580-$81 
Boolean algebra theorems (布尔 代数 定理 )， 
582-583 
combinational circuits (组 合 电路 )，579 
logic diagrams (G#4), 585-587 
proving complements (互补 证 明 )，583-585 
truth tables ( 真 值 表 )，580 
compaction (合并 )，538 
compilation process (编译 过 程 )，420-421 
compilers, optimizing (编译 器 ， 优 化 )，298 
complements (互补 律 )， 参 见 Boolean algebra 
complex instruction set computer (复杂 指令 集 计 
算 机 )， ÆI CISC 
computer architecture (计算 机 系统 结构 )，183- 
226 
direct addressing (直接 寻 址 )，193-206 
add instruction (加 法 指令 )，197-198 
and and or instructions (AND 和 OR 指令 )， 
199-200 
big-endian versus little-endian orders (大 端 
FF A) ain FF), 204-206 
input and output devices (输入 和 和 给 出 设备 )， 
203-204 
invert and negate instructions ( 按 位 取 反 和 取 
负 指 令 )，200-201 
load byte and store byte instructions ( 字 节 装 
人 和 字 节 存储 指令 )，202-203 
load word instruction ( 字 装 人 指令 )，194-195 
stop instruction (停止 指令 )，194 
store word instruction ( 字 存 储 指令 )，196 
subtract instruction (减法 指令 )，198-199 
hardware (硬件 )，184-193 
central processing unit (中 央 处 理 单 元 )，185- 
]86 
data and control (数据 和 控制 )，189 
input/output devices (输入 /输出 设备 )，188 
instruction format (指令 格式 )，189-193 
main memory ( 主 存储 器 )，186-188 
programming at Level ISA3(ISA3 层 上 的 编程 )， 
221-226 
Pep/9 operating system ( Pep/9 操作 系统 )， 
222-225 


read-only memory (只 读 存 储 器 )、221-222 
using Pep/9 system (使 用 Pep/9 系统 )，225- 
226 
von Neumann machines (7 + 诺 依 曼 机 器 )，206- 
220 
bugs (漏洞 )，214 
character input program (字符 输入 程序 )， 
214-216 
character output program (字符 输出 程序 )， 
208-214 
decimal to ASCII conversion (十 进 制 转换 为 
ASCII #5), 216-217 
execution cycle (执行 周期 )，206-208 
self-modifying program (修改 自身 的 程序 )， 
217-220 
computer chips (计算 机 芯片 )，39 
computer organization (计算 机 组 成 ) 
big picture (全 局 )，772-774 
Level-ISA3 machine (ISA3 层 机 器 ) 
add immediate instruction( 立即 数 加 法 指令 )， 
707-709 
arithmetic shift right instruction (算术 右 移 指 
令 )，712-713 
bus protocols (总 线 协议 )，705 
CPU control section ( CPU 控制 部 分 )，713- 
716 
CPU data section (CPU 数据 部 分 )，692-696 
load word indirect instruction ( 装 人 字 间 接 
寻 址 指令 )，709-712 
store byte direct instruction (存储 字 节 直接 寻 
址 指令 )，703-704 
store word direct instruction (存储 字 直 接 寻 
址 指令 )，706-707 
von Neumann cycle (75 - 诺 依 曼 机 器 )，696- 
703 
MIPS machine (MIPS #L##), 755-760 
addressing modes ( 寻 址 方式 )，745-749 
computer organization (计算机 组 成 )，755-760 
instruction set (指令 集 )，749-755 
pipelining (流水 线 )，760-771 
register set (寄存 器 组 )，743-744 
performance (性 能 )，716-717 
cache memories ( 高速 缓存 存储 央 )，729-738 
data bus width (数据 总 线 宽 度 )，717-722 
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memory alignment ( 内存 对 齐 )，722-727 
n-bit computer, definition of an (n 位 计算 机 
的 定义 )，727-729 
RISC versus CISC ( RISC 与 CISC )，739- 
741 
system performance equation (系统 性 能 公 
式 )，738-739 
simplifications in model (模型 简化 )，771-772 
computer systems (计算 机 系统 )，3-46 
database systems (数据 库 系 统 )，40-46 
digital information (数字 信息 )，22-38 
hardware (硬件 )，11-17 
levels of abstraction ( 轴 疝 层次 )，4-11 
software (软件 )，17-22 
Concatenation (连接 )，393-394 
Concurrent processes (并 发 进程 )，501-516 
conditional branch instructions (条 件 分 支 指令 )， 
295 
conjunction operations ( 合 取 操作 )，138 
Consensus theorem (合意 定理 )，583， 参 见 Boolean 
algebra 
Constants (#3), 275-279 
context-free grammars ( 上下文 无 关 语 法 )，400 
Context sensitive grammar (上 下 文 相关 语法 )， 
399-400, 407-408 
contiguous allocation (连续 分 配 )，552 
control characters (控制 符 )，147-148 
control lines (控制 线 )，670-672 
conversion between bases (基数 之 间 的 转换 )， 参 
见 base conversions 
core memory (核心 存储 器 )， 参 见 main memory 
cores, definition of (核心 定义 )，40 
cost of recursion (递归 的 成 本 )，99-100 
CPWA instruction (CPWA 指令 )，299 
CPWr instruction (CPWr 指令 )，298 
CR-LF convention (CR-LF 惯例 )，148 
Critical section (Ii IX), 508-509 
with semaphore ( 带 信号 量 的 临界 区 )，513-516 
CSMux, 694-695 


D 


D flip-flop (D 触发 器 )，653-654 
block diagram ( 方 框图 )，653 


characteristic table for ( D 触发 器 的 特征 表 )， 
653 
constructing, from SR flip-flop (从 SR 触发 器 
构建 D 触发 器 )，654 
implementation of (D 触发 器 的 实现 )，654 
timing diagram for (D 触发 器 时 序 图 )，653 
dark module, QR code (QR 码 的 深 色 模块 )，29 
data and control (数据 和 控制 )，189 
data bits, QR code (QR 码 的 数据 位 )，31-32 
data bus width (数据 总 线 的 宽度 )，717-722 
data file (数据 文件 )，19 
Date forwarding (数据 传送 )，769， 参 见 Pipelining 
database management system (DBMS, 数据 库 管 
FHA SZ), AIL database systems 
Database system (数据 库 系 统 ) 
language, structure of (语言 结构 )，45-46 
queries (查询 )，42-45 
relations (关系 )，41-42 
De Morgan’s law ( 德 ， 摩根 定律 )，583-584 
for three variables (三 变量 的 德 * 摩根 定律 )， 
584-585 
Deadlock ( 死 锁 ) 
definition of ( 死 锁定 义 )，513 
Peterson’s algorithm avoiding ( Peterson 算法 避 
免 死 锁 )，513 
Policy (策略 )，519 
resource allocation graphs (资源 分 配 图 )，517- 
519 
DECI instruction (DECI #§ 4), 237, 248-251, 
488-501 
decimal prefixes (十 进 制 前 级 )，24-25 
decimal to ASCII conversion (十 进 制 到 ASCII 码 
的 转换 )，216-217 
decimal to binary conversion (十 进 制 到 二 进 制 的 
转换 ) 
floating-point representation( 浮 点 表示 )，154- 
155 
two’s complement binary representation (二 进 
制 的 补 码 表示 )，130 
unsigned binary representation (无 符号 二 进 制 
表示 )，123 
DECO instruction (DECO 指令 )，237，248-251 
Decoder ( 译 码 器 )，611， 参 见 Binary decoder 
decompression chamber analogy ( 减 压 舱 类 比 )，647 


defragmenting (清理 )，554 
delay flip-flop (HEIR fh 4%), AJL D flip-flop 
demand paging ( 按 需 取 页 )，5$45-546 
De Morgan’s law ( 德 . 摩根 定律 )， 参 见 Boolean 
algebra 
Demultiplexer (多 路 分 配器 )，612-613 
denormalized numbers, representation of ( 非 规格 
化 数字 表示 )，162-163 
Derivations, in a grammar (语法 推导 )，397，406 
detect and recover policy, of deadlock ( 死 锁 的 发 
现 并 恢复 策略 )，519 
Deterministic FSM (确定 性 FSM)， 参 见 Finite 
state machine 
digital information (数字 信息 )，22-38 
images (图 像 )，32-38 
quantifying space (空间 量化 )，22-25 
quantifying time (时 间 量 化 )，25-27 
quick response codes (快速 响应 码 )，27-32 
digraph (图 )，408 
Dijkstra, Edsger W., 309-310 
direct addressing ( H$% FHE), 193-206, 247-248, 
486, # JL addressing modes 
add instruction (加 法 指令 )，197-198 
and and or instructions (AND 和 OR 指令 ), 
199-200 
big-endian versus little-endian orders (大 端 序 
和 小 端 序 )，204-206 
input and output devices (输入 和 输出 设备 )， 
203-204 
invert and negate instructions ( 按 位 取 反 和 取 负 
指令 )，200-201 
load byte and store byte instructions ( 装 入 字 节 
和 存储 字 节 指 令 )，202-203 
load word instruction ( 装 人 字 指 令 )，194-195 
stop instruction (停止 指令 )，194 
store word instruction (存储 字 指 令 )，196 
subtract instruction (减法 指令 )，198-199 
direct-code parser (直接 编码 分 析 器 )，423-426 
direct-mapped cache (直接 映射 高 速 缓存 )，732- 
734 
Direct Media Interface (DMI， 直 接 媒体 接口 )，40 
Direct memory access ( DMA， 直 接 内 存 访问 )， 
17, 189, 772 
directed graph (有 问 图 )，408 


dirty bit ( 脏 位 )，546-547 
Disassemblers( 反 汇编 器 )，255-257 
disjunction operations ( 析 取 操作 )，138 
disk (磁盘 )，16-17 
disk drives (磁盘 驱动 器 )，5S0-551 
DisplayPort, 40 
Distributive law (4} fic ft), 581, Æ JL Boolean 
algebra 
divide and conquer strategy 【分 治 策略 )，86 
do loop (do JER), 69-70, 302-303 
nonatomic nature of ( do 循环 的 非 原 子 特 性 )， 
510 
document (文档 ) 
abstraction in (文档 中 的 抽象 )，7-8 
file (文件 )，19 
domains, definition of ( 域 的 定义 )，42 
Don’t- care conditions (无 关 条 件 )，608-609， 参 
见 Karnaugh maps 
dual Karnaugh maps (41 (fi-Fi# FA), 607-608 
Duality (对 偶 性 )， 参 见 Boolean algebra 
Dynamic branch prediction (动态 分 支 预测 )， 
766-767, ÆJ Pipelining 
dynamic memory (动态 内 存 )，673 
Dynamic memory allocation (动态 内 存 分 配 )， 
102-108, 356-377 
global pointers (全 局 指针 )，357-363 
linked data structures ($ë xt 2c Hi 44 #9), 105- 
108 
local pointers (局 部 指针 )，363-367 
operators that control (控制 动态 内 存 分 配 的 运 
算 符 )，102 
pointers (指针 )，102-104 
structures (结构 )，104-105 
global (全 局 )，367-372 
linked data ( 链 式 数据 )，372-377 
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Eckert, J. Presper, 118, 206 

Edge-triggered flip-flops (边缘 触发 的 触发 器 )， 
644 

Electrically erasable PROM (EEPROM, #4 Al # 
除 PROM), 674 
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Electronic Delay Storage Automatic Calculator 
(EDSAC， 电 子 延 迟 存储 自动 计算 器 )， 
206 
Electronic Numerical Integrator and Calculator 
(ENIAC， 电 子 数 值 积分 计算 机 )，118， 
206 
elements of array, reversing (逆转 数组 元 素 顺 序 )， 
94-95 
ellipses (椭圆 形 )，169 
Empty string ( 空 字符 串 )，394 
Empty transition (空转 移 )，412-415 
algorithm to remove (消除 空转 移 的 算法 )， 
413-415 
as nondeterministic (空转 移 是 非 确 定性 的 )， 
413 
Enable lines, definition of (使 能 线 的 定义 )，609 
.END pseudo-op (.END 伪 操作 )，238-240 
.EQUATE pseudo-op (.EQUATE 伪 操 作 )，238， 
275-279, 292-294 
erasable PROM (EPROM, FJR PROM), 674 
Error-correcting codes (444813), 557-562 
Error-detecting codes (#4403), 555-557 
Excess representation (RKR), 156-157 
Excitation tables (激励 表 )，655 
characteristic tables versus (特征 表 与 激励 表 )， 
650 
construction of (构建 激励 表 )，650 
for D flip-flop (D 触发 器 )，655 
for JK flip-flop (JK 触发 器 )，655 
for SR flip-flop (SR 触发 器 )，649 
for T flip-flop (T 触发 器 )，655 
Exclusive OR ( 异 或 )， 参见 XOR 
execution cycle, von Neumann Machines (73 + i 


依 曼 执行 周期 )，206-208 
F 


factorial function (阶乘 函数 )，82-85 
feedback circuits (反馈 电路 )，638 
stable state (稳定 状态 )，639 
unstable state (不 稳定 状态 )，638 
field, definition of (字段 的 定义 )，104 
FIFO page-replacement algorithm ( FIFO 页 替换 
算法 )，547-549 
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file abstraction (文件 抽象 )，551 
file management (文件 管理 )，549-550 
allocation techniques (分 配 技 术 )，552-554 
disk drives (RIKZ), 550-551 
file abstraction (文件 抽象 )，551 
files (文件 ) 
management of (文件 管理 )，19-20 
types of information (信息 的 类 型 )，19 
finder patterns, QR code (探测 图案，QR ), 
28-29 
Finite state machine ( FSM， 有 限 状 态 机 )，392， 
408-435, 771, 773-774 
concept of (有 限 状 态 机 的 概念 )，773-774 
in DECI (DECI 中 的 有 限 状 态 机 )，488 
deterministic (确定 型 有 限 状 态 机 )，414，448- 


449 
with empty transitions (有 限 状 态 机 中 的 空转 
移 )，412-415 


grammars versus (语法 与 有 限 状态 机 )，417-418 
implementation of (有 限 状 态 机 的 实现 )，418-435 
compilation process (编译 过 程 )，420-421 
direct-code parser (直接 编码 分 析 器 )，423- 
426 
input buffer class (输入 缓冲 区 类 )，426-428 
multiple-token parser (多 token 分 析 器 )，428- 
435 
table-lookup parser (查找 表 分 析 器 )，421-423 
multiple token recognizers (多 语言 符号 识别 器 )， 
415-417 
nondeterministic ( 非 确定 型 有 限 状 态 机 )，410- 
412 
to parse identifier (用 有 限 状 态 机 分 析 标识 符 )， 
409-410 
simplified (简化 的 有 限 状态 机 )，410 
First-fit algorithm (最 先 适 配 算法 )，538 
first fit versus best fit (最 先 适 配 与 最 佳 适 配 )， 
539 
first-in, first-out (FIFO， 先 进 先 出 )，547-549 
fixed-partition multiprogramming (固定 分 区 多 道 
程序 )，533-534 
Flash memory (闪存 )，674 
flip-flop (触发 器 )，642 
floating-point division ( 浮 点 数 除法 )，63-64 
Floating point representation ( 浮 点 数 表 示 )，153- 


168 
binary fractions (二 进 制 小 数 )，154-156 
excess representations ( 余 码 表示 )，156-157 
hidden bit (隐藏 位 )，158-159 
IEEE 754 floating-point standard ( IEEE754 浮 
点 数 标准 )，165-168 
special values (特殊 值 )，159-165 
flow of control (控制 流 )，65-72 
arrays (数组 )，70-72 
different styles of (不 同 的 类 型 )，307 
do loop (do 循环 )，69-70 
in early languages (早期 语言 的 控制 流 )，307- 
308 
for loop (for 循环 )，70-72 
if / else statement (if/else 语句 )，66-67 
structured (结构 化 控制 流 )，307 
switch statement (switch 语句 )，67-68 
while loop (while 循环 )，68-69 
for loop (for fE), 70-72, 303-305 
formal parameter (形式 参数 )，75 
format information area, QR code (格式 信息 区 ， 
QR 13), 29 
format trace tags (格式 跟踪 标签 )，273，294， 
339, ÆJ. trace tags 
FORTRAN, 307-309 
four-variable Karnaugh maps (四 变量 卡 诺 图 )， 
604-607 
fractions, binary (二 进 制 小 数 )，154-156 
fragmentation (Fr), 537-538 
Full adder (全 加 器 )，613， 参 见 Adder 
function calls ( RK% ), 310-313 
non-void (JE), 320-323 
function SE(im) (函数 SE(im)), 747 
Functions ( 函数 )，72-81， 参 见 Parameter 
call-by-reference parameters ( 传 参 调用 )，76- 
81 
call-by-value parameters ( 传 值 调 用 )，72-75 
call mechanism ( ek BCH FH Lil), 310-332 
void (SRX), 313 
void functions (JES KX), 72-75 
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Gate delay ( 门 延迟 )，593-594 
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global arrays (全 局 数组 )，337-340 
memory allocation for (全 局 数组 的 内 存 分 配 )， 
339 
translation rules for (全 局 数组 的 翻译 规则 )， 
340 
global pointers (全 局 指针 )，357-363 
global structures (全 局 结构 )，367-372 
global variables (全 局 变量 )，59-62，267-271， 
参见 variables 
address operator (地 址 运算 符 )，61 
assignment operator (赋值 运算 符 )，61 
call-by-reference parameters with (用 全 局 变量 
翻译 传 引用 调用 参数 )，323-328 
call-by-value parameters with (用 全 局 变量 翻 
译 传 值 调用 参数 )，313-317 
local versus (局 部 与 全 局 变量 )，292 
memory model for (全 局 变量 的 内 存 模型 )，62 
glyph (象形 文字 )，149 
Goto controversy (Goto 争议 )，309-310 
goto statement (goto 语句 )，307-308 
gradual underflow (CZK F vit), 162 
Grammar (if? ), 392, 395-396 
for C identifiers (C 标识 符 语 法 )，396-398 
for C language (C 语言 语法 )，402-407 
context sensitive (上 下 文 有 关 语 法 )，399-400， 
407-408 
for expressions (表达 式 语 法 )，401-402 
finite-state machines versus (有 限 状 态 机 与 语 
法 )，417-418 
four parts of (语法 的 4 个 部 分 )，395 
for signed integer (有 符号 整数 的 语法 )，398- 
399 
grayscale images ( 灰 度 图 像 )，32-34 
accuracy of (图 像 的 精确 度 )，33 
binary storage (二 进 制 存储 )，33-34 
number of pixels, increasing (增加 像素 数量 )， 
33 


H 


Galf adder ( 半 加 器 )，613， 参 见 Adder 
Hamming distance ( 海 明 距 离 )，5$56-557 
Hardware (硬件 )，11-17 

central processing unit (中 央 处 理 单元 )，12-13 


concurrency (并 发 )，702 
disk (磁盘 )，16-17 
main memory ( 主 存 )，13-16 
head crash (磁头 碰撞 )，551 
heap pointer( 堆 指针 )，359-360 
Hexadecimal representaion (十 六 进 制 表示 )， 
142-153 
base conversions (基数 转换 )，143-146 
conversion chart (转换 表 )，144 
HEXO instruction ( HEXO 指令 )，237，252-255， 
498-501 
Hidden bit (隐藏 位 )，158-159 
hierarchy diagrams, abstraction (抽象 的 层次 图 )，5 
leaf (Ht), 5 
node ( 结 点 )，5 
root ( 根 )，5 
High-Definition Multimedia Interface (HDMI, 
高 清晰 多 媒体 接口 )，40 
high-order languages, at Level HOL6 ( HOL6 Jz 
的 高 级 语言 )，10 
HOL6，10，262-279 
Boolean types at (HOL6 层 的 布尔 类 型 )，333 
call-by-reference parameters ( 传 引用 调用 参数 ) 
with global variables at ( 带 全 局 变量 的 传 引 
用 调用 参数 )，324 
with local variables at ( 带 局 部 变量 的 传 引用 
调用 参数 )，329 
call-by-value parameters ( 传 值 调 用 参数 ) 
with global variables at ( 带 全 局 变量 的 传 值 
调用 参数 )，314 
with local variables at( 带 局 部 变量 的 传 值 调 
用 参数 )，318 
do loop at (HOL6 层 的 do 循环 )，302-303 
for loop at (HOL6 层 的 for 循环 )，304 
function call at (HOL6 层 的 函数 调用 )，311 
non-void ( 非 空 )，320-322 
global arrays at (HOL6 层 的 全 局 数组 )，337 
global pointers at (HOL6 层 的 全 局 指针 )，357， 
363 
global structures at (HOL6 层 的 全 局 结构 )， 
368, 370 
if statement at (HOL6 层 的 证 语句 )，300 
if/else statement (HOL6 层 的 if/else 语句 )，299 
illegal and legal at (非法 的 和 合法 的 )，272 
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information representation at ( HOL6 层 的 信息 
表示 )，118,169-170 

linked data structures at (HOL6 层 的 链 式 数据 
结构 )，372, 375 

local arrays at (HOL6 层 的 局 部 数组 )，341 

local pointers at (HOL6 层 的 局 部 指针 )，363， 
365 

logical operators, truth tables for ( HOL6 层 上 
逻辑 运算 符 的 真 值 表 )，138 

parameter arrays at ( HOL6 层 的 参数 数组 )， 
345 

procedure call at (HOL6 层 的 过 程 调用 )，311 

switch statement at ( HOL6 层 的 switch 语句 ), 
351 

while loop at ( HOL6 Jz fi while (if # ), 300- 
301 


IBM 360 family (IBM 360 系列 )，727 
Idempotent property (ERE), 582-583, AL 
Boolean algebra 
identifiers, definition of (标识 符 的 定义 )，45 
Identity element (单位 元 )，394 
IEEE 754 floating-point standard ( IEEE 754 浮 点 
表示 标准 )，165-168 
if statement (if iJ), 295-297 
if/else statement (if/else iJ), 66-67, 298-300 
ignore policy, of deadlock ( 死 锁 的 无 视 策略 )， 
519 
images (811%), 32-38 
accuracy of (图 像 的 精确 度 )，33 
binary storage (图 像 的 二 进 制 存储 )，33-34 
black and white (黑白 图 像 )，32-34 
color (彩色 图 像 )，34-38 
grayscale( 灰 度 图 像 )，32-34 
number of pixels (图 像 的 像素 数 )，33 
Immediate addressing (立即 数 寻 址 )，247-248， 
250，487， 参 见 Addressing mode 
format for (立即 数 寻 址 的 格式 )，747 
index (索引 )，554 
indexed addressing and arrays ( 变 址 寻 址 与 数组 )， 
336-356， 参 见 addressing modes 
arrays passed as parameters (数组 当 作 参数 传 


iB), 344-350 
global arrays (全 局 数组 )，337-340 
local arrays (局 部 数组 )，341-344 
switch statement (switch 语句 )，350-354 


Indirect addressing (H] #4 hE), 362, 487, & 


JL Addressing mode 


infinity, representation of (无 穷 大 的 表示 )，161 
information representation (信息 表示 )，117 


character representations (字符 表示 ) 
ASCII characters (ASCII F47), 146-149 
Unicode characters (Unicode #4), 149-153 
floating-point representation ( 浮 点 数 表示 )， 
153-168 
binary fractions (二 进 制 小 数 )，154-156 
excess representations ( 余 码 表示 )，156-157 
hidden bit (隐藏 位 )，158-159 
IEEE 754 floating-point standard ( IEEE 754 
浮 点 表示 标准 )，165-168 
special values (特殊 值 )，159-165 
hexadecimal representation (十 六 进 制 表示 )， 
142-153 
base conversions (基数 转换 )，143-146 
models (模型 )，168-170 
operations in binary (二 进 制 运算 )，136-142 
arithmetic operators (算术 运算 符 )，139-141 
logical operators (逻辑 运算 符 )，137-138 
register transfer language( 寄 存 器 传送 语言 )， 
138-139 
rotate operators (循环 移 位 运算 符 )，141-142 
two’s complement binary representation ( 二 进 
制 补 码 表示 )，125-136 
base conversions (基数 转换 )，130-131 
negative and zero bits (负数 和 零 位 )，135- 
136 
number line〈 数 轴 )，131-133 
overflow bit (Ym iti iz), 133-135 
two’s complement range (二 进 制 补 码 范 围 )， 
128-129 
unsigned binary representation (无 符号 二 进 制 
表示 )，118-125 
base conversions (基数 转换 )，121-123 
binary storage (二 进 制 存储 )，118-119 
carry bit (进位 位 )，125 
integers (整数 )，119-121 


range for unsigned integers (无 符号 整数 范 
fal), 123-124 
unsigned addition (无 符号 加 法 )，124-125 
input buffer class (输入 缓冲 区 类 )，426-428 
input/output (I/O) devices (输入 /输出 设备 )，188 
direct addressing (直接 寻 址 )，203-204 
instruction format (指令 格式 )，189-193 
instruction register (指令 寄存 器 )，14 
Instruction set (指令 集 ) 
MIPS (指令 集 )，749-755 
Pep/9 at Asmb5 ( Asmb5 层 的 Pep/9 指令 集 )， 
236-237 
Instruction specifier (指令 指示 符 )，189，191 
integer division (整数 除法 )，63-64 
integers (整数 ) 
conversions (转换 )， 参 见 base conversions 
signed (有 符号 )，398-399 
unsigned binary representation (无 符号 二 进 制 
表示 )，119-121 
integrated development environment ( IDE， 集 
成 开发 环境 )，100-101 
integrated memory controller ( IMC， 集 成 内 存 


控制 器 )，40 
Intel Core i7 system ( Intel Core i7 系统 )，39- 
40 


internal fragmentation (AMBRE), 542 
interpretation, advantages and disadvantage of 
(解释 的 优 缺 点 )，420 
invert instructions ( 取 反 指令 )，200-201 
inverter (J2#H#%), 585-587 
I/O completion (1/0 完成 )，502-503 
ISA3, 10 
construction of add immediate instruction (47. 
即 数 加 法 指令 结构 )，707-709 
arithmetic shift right instruction (算术 右 移 指 
令 )，712-713 
bus protocols (总 线 协议 )，705 
CPU control section ( CPU 控制 部 分 )，713- 
716 
CPU data section (CPU 数据 部 分 )，692-696 
load word indirect instruction ( 字 装 人 间接 
寻 址 指令 )，709-712 
store byte direct instruction ( 字 节 存储 直接 
寻 址 指令 )，703-704 


store word direct instruction ( 字 存 储 直 接 寻 
址 指令 )，706-707 
von Neumann cycle (V5 + 诺 依 曼 周 期 )， 
696-703 
information representation at (ISA3 层 的 信息 
表示 )，118，169-170 
logical operators, truth tables for (逻辑 运算 符 
真 值 表 )，137 
Pep/9 instruction set at ( ISA3 层 的 Pep/9 指令 
集 )，190 
programming at (IAS3 层 的 编程 )，221-226 
Pep/9 operating system ( Pep/9 操作 系统 )， 
222-225 
read-only memory (只 读 存 储 器 )，221-222 
using Pep/9 system (使 用 Pep/9 系统 )，225- 
226 
types of bit patterns at (ISA3 层 的 位 模式 类 型 )， 
234 


J 


Jacopini, Giuseppe, 308 
Java Virtual Machine (JVM, Java 虚拟 机 )，419 
JK flip-flop (JK 触发 器 )，650-653 
block diagram of (JK 触发 器 的 方 框图 )，651 
characteristic table for ( JK 触发 器 的 特征 表 )， 
651 
constructing, from SR flip-flop (从 SR 触发 器 
构造 JK 触发 器 )，651-652 
design tables, constructing (构造 设计 表 )，651- 
652 
implementation of (JK 触发 器 的 实现 )，653 
jump register instruction (寄存 器 跳 转 指令 )，749 
jump table ( 跳 转 表 )，353 


K 


Karnaugh map (FH), 599-609 
Don’t care conditions (无 关 条 件 )，608-609 
dual (对 偶 )，607-608 
equivalent of idempotent property ( 卡 诺 图 等 价 
于 分 配 律 )，602-603 
four-variable (四 变量 卡 诺 图 )，604-607 
three-variable (三 变量 卡 诺 图 )，599-604 
Kepler, Johannes, 168-169 
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Language (i F), 394-395 
structure of (语言 结构 )，45-46 
translator (语言 翻译 器 )，435-455 
language translation principles (语言 翻译 原则 ) 
code generation (代码 生 成 )，435-456 
language translator (语言 翻译 器 )，435-455 
parser characteristics (语言 分 析 器 特性 )， 
455-456 
concatenation (i432), 393-394 
finite-state machines (A RARASHL), 408-435 
with empty transitions ( 带 空转 换 的 有 限 状 态 
机 )，412-415 
grammars versus (语法 vs. 有 限 状 态 机 )， 
417-418 
implementation of( 有 限 状 态 机 的 实现 )， 
418-435 
mnultiple token recognizers (多 语言 符号 识别 
器 )，415-417 
nondeterministic ( 非 确定 性 )，410-412 
to parse an identifier (用 有 限 状态 机 分 析 标 
识 符 )，409-410 
simplified (简化 的 有 限 状 态 机 )，410 
grammars (语法 )，395-396 
for C identifiers (C 标 识 符 的 语法 )，396- 
398 
for C language (C 语言 的 语法 )，402-407 
context-sensitive (上 下 文 相关 )，399-400， 
407-408 
for expressions (表达 式 的 语法 )，401-402 
four parts of (语法 的 4 个 部 分 )，395 
for signed integers (有 符号 整数 的 语法 )， 
398-399 
languages (语法 )，394-395 
parsing problem (语法 分 析 问 题 )，400-401 
large program behavior (大 程序 的 行为 )，543 
latches( 锁 存 器 )，638-641 
Latency (延迟 )，16，551 
LDWr instruction (LDWr 指令 )，709-712 
least recently used (LRU， 最 近 最 少 使 用 )，547-549 
least significant bit (最 低 有 效 位 )，121 
left-symmetric parity distribution ( 左 对 称奇 偶 校 
验 分 布 )，569 


level diagrams, abstraction (抽象 的 层次 图 )，5 
level sensitive flip-flop ( 电 平 敏感 的 触发 器 )， 
643 
lexical analysis (词法 分 析 )，420 
lexical analyzer (词法 分 析 器 )，447-448，455 
LG1, 10-11 
linked allocation technique (链接 分 配 技术 )，553- 
554 
Linked data structures (链接 的 数据 结构 )，105- 
108, 372-377 
little-endian order (小 端 序 )，204-206 
Load byte instruction (加 载 字 节 指 令 )，202-203 
load word indirect instruction ( 字 装 人 间接 寻 址 
指令 )，709-712 
load word instruction ( 字 装 入 指令 )，194-195 
Loader (装载 器 )，470 
Invoking (调用 )，472 
Pep/9 loader (Pep/9 装载 器 )，472-474 
Pep/9 operating system (Pep/9 操作 系统 )，471- 
472 
program termination (程序 的 终止 )，474-475 
relocatable (可 重 定位 的 )，534 
load/store machines ($$ A /存储 机 器 )，743 
local arrays (局 部 数组 )，341-344 
memory allocation for (局 部 数组 的 内 存 分 配 )， 
343 
translation rules for (局 部 数组 的 翻译 规则 )， 
344 
local pointers (局 部 指针 )，363-367 
local structures (局 部 结构 )，371-372 
Local variable (局 部 变量 )，62-65, 292-294， 参 
见 Variable 
call-by-reference parameters with ( 带 局 部 变量 
的 传 引 用 调用 参数 )，329-332 
call-by-value parameters with ( 带 局 部 变量 的 
传 值 调 用 参数 )，317-320 
floating-point division ( 浮 点 数 除法 )，63-64 
global versus (全 局 与 局 部 变量 )，292 
integer division (整数 除法 )，63-64 
memory model for (局 部 变量 的 内 存 模型 )，65 
program with ( 带 局 部 变量 的 程序 )，293 
locality of reference (引用 局 部 性 )，730 
Logic diagram (i 44/4] ), 585-587, 589 
and boolean expression (逻辑 图 和 布尔 表达 式 )， 
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589-591 
logic gates (逻辑 门 ) 
alternate representations (其 他 表达 方式 )，587- 
588 
Boolean algebra (布尔 代数 )，580-581 
Boolean algebra theorems (布尔 代数 定理 )， 
582-583 
combinational circuits (组 合 电 路 )，579 
at Level LG1 (LG1 层 的 逻辑 门 )，11 
logic diagrams (Z$), 585-587 
proving complements (互补 证 明 )，583-585 
truth tables ( 真 值 表 )，580 
logic programming (逻辑 编程 )，587 
Logical addresses (逻辑 地 址 )，534-537，544 
logical operators (逻辑 运算 符 )，137-138 
LRU page-replacement algorithm (页 替换 算法 )， 
549 
lui instruction, MIPS (lui ff“, MIPS), 754 
lw instruction, MIPS (lw ##4, MIPS), 751 


M 


machine language (机 器 语言 )，193 
at Level ISA3 (ISA3 层 的 机 器 语言 )，10 
Machine vector (机 器 向 量 )，223 
advantage of (机 器 向 量 的 优点 )，225 
machines (机 器 ) 
abstraction in (机 器 的 抽象 )，9 
independence (无 关 性 )，57 
main() , 264, 288 
main memory ( EFF), 13-16, 186-188, 194 
malloc() function (malloc() 函数 )，359-361 
Mark I computer (Mark I 计算 机 )，118 
Master-slave SR flip-flop ( 主 从 SR 触发 器 )，643- 
648 
block diagram of (EM SR 触发 器 方 框图 )，645 
characteristic tables (EM SR 触发 器 的 特征 表 )， 
647-648 
implementation of ( 主 从 SR 触发 器 的 实现 )， 
645 
operation of ( 主 从 SR 触发 器 的 操作 )，645 
state transition diagram for ( 主 从 SR 触发 器 的 
状态 转换 图 )，648 
timing diagram of ( EM SR 触发 器 的 时 序 图 )， 


647 
Matisse, Henri, 5-6 
Mauchly, John W., 118 
Mc2, 10-11 
MDRMux, 694 
Megahertz myth ( 主 频 神话 )，770 
Memory (存储 器 ) 
access, direct (直接 访问 )，189 
alignment (内 存 对 齐 )，722-727 
hierarchies (存储 器 层次 结构 )，738 
location and address, distinction between (内 存 
单元 和 地 址 的 区 别 )，187, 188 
main ( 主 存 )，186-188，289，291 
of Pep/9 (Pep/9 的 主 存 )，471 
mapping, Pep/9 (Pep/9 内 存 映射 )，221 
programmable read-only (可 编程 只 读 存 储 器 )， 
222 
random access (随机 访问 存储 器 )，222 
read-only (只 读 存 储 器 )，221-222 
read/write ( 读 / 写 )，222 
volatile ( 易 失 性 存储 器 )，222 
memory address (内 存 地 址 )，257 
memory address register ( MAR， 内 存 地 址 寄存 
At), 694 
memory alignment (内 存 对齐 )，722-727 
memory allocation (内 存 分 配 )，532 
fixed-partition multiprogramming (固定 分 区 多 
道 程序 设计 )，533-534 
logical addresses (2 thbht), 534-537 
paging (4}.51), 540-543 
uniprogramming ( 单 道 程 序 设 计 )，532-533 
variable-partition multiprogramming (可 变 分 区 
多 道 程序 设计 )，537-540 
memory chip (存储 器 芯片 )，669-672 
control lines (控制 线 )，670, 672 
read enable box ( 读 使 能 方 框 )，673 
reading from (从 存储 器 芯片 读 )，670 
writing to( 向 存储 器 芯片 写 )，670 
memory data register ( MDR ， 内 存 数据 寄存 器 )， 
694 
memory hierarchy (存储 器 层次 )，738 
memory management (存储 管理 )，19 
algorithms (算法 )，359 
memory-mapped input/output (I/O) (内 存 映 射 输 
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入 /输出 )，14，188 
memory read bus protocol (内 存 读 总 线 协议 )， 
705 
memory-style ECC (内 存 风格 的 ECC), 566-567 
memory subsystems (存储 器 子 系统 )，669-674 
address lines (地 址 线 )，669-670 
control lines (控制 线 )，670-672 
dynamic memory (DRAM， 动 态 存 储 器 )，673 
electrically erasable PROM ( 电 可 擦 除 PROM), 
674 
erasable PROM (可 擦 除 PROM)，674 
flash memory (闪存 )，674 
memory chips (存储 器 芯片 )，669-672 
memory write operation (存储 器 写 操作 )，672- 
673 
monostable multivibrator ( 单 稳 多 谐振 荡 器 )， 
672 
programmable ROM (可 编程 ROM)，673-674 
read enable box ( 读 使 能 方 框 )，673 
read-only memory (只 读 存 储 器 )，673 
static memory (静态 存储 器 )，673 
memory write bus protocol (存储 器 写 总 线 协议 )， 
705 
metric prefixes (公制 前 级 )，23 
microprogramming, at Level Mc2 ( Mc2 层 微 程序 
iit), 11 
Microsoft Macro Assembler (MASM, Microsoft 
宏 汇编 器 )，354 
Minterm (最 小 项 )，598-599 
MIPS machine (MIPS 机 器 )，743-771 
addressing modes ( 寻 址 方式 )，744-749 
computer organization (计算 机 组 织 )，755-760 
instruction set (指令 集 )，749-755 
pipelining (流水 线 )，760-771 
register set (寄存 器 组 )，743-744 
Mnemonics( 助 记 符 )，234-238 
mode indicator, QR code (模式 指示 器 ，QR WS), 
30-31 
module, QR code (模块 ，QR #5), 28 
Monostable multivibrator ( 单 稳 多 谐振 水 器 )，672 
Moore, Gordon, 728 
Moore’s Law (摩尔 定律 )，728-729 
most significant bit (最 高 有 效 位 )，125 
MOVSPA instruction (MOVSPA 指令 )，332 


multi-user operating systems (多 用 户 操作 系统 )， 
470 
multiple-token parser (多 语言 符号 分 析 器 )，428- 
435 
Multiple token recognizers (多 语言 符号 识别 器 )， 
415-417, 428-435 
Multiplexer ( 复 用 器 ， 多 路 复 用 器 )，610-611 
Multiplication algorithm (乘法 算法 ) 
iterative (RHY), 383-384 
recursive (递归 的 )，382 
Multiprocessing (多 处 理 )，505-506，508 
Multiprogramming (多 道 程序 设计 )，503，508 
fixed-partion (固定 分 区 的 )，533-534 
variable-partition (可 变 分 区 的 )，537-540 
Mutual exclusion (4 JF ) 
first attempt at (第 一 次 尝试 实现 互 斥 )，509- 


510 

Peterson’s algorithm for ( 互 斥 的 Peterson’s 算 
7), 512-513 

second attempt at (第 二 次 尝试 实现 互 斥 )， 
510-512 


mutual recursion (相互 递 归 )，98-99 
function prototype (函数 原型 )，98-99 
in recursive descent compiler (递归 下 降 编译 器 
中 的 相互 递归 )，99 


N 


N bit (N f¥), 135-136, 194-195, 198-199, 619 

n -bit computer (n 位 计算 机 )，727-729 

NaN (not a number), representation of ( NaN 的 表 
7R), 161 

NAND gate (NAND ['J), 586-587 

NAND-NAND circuit (NAND-NAND 电路 )，595- 
596 

Negate instruction ( 取 负 指令 )，200-201 

negation operation (WH tE), 126 

Negative bit (负数 位 )， 参 见 N bit 

negative numbers, convenient property of (负数 的 
便利 属性 )，126 

nesting diagrams, abstraction (H#AMREA), 5 

NetBeans IDE, 101 

node, definition of (477372 %), 105 

Nondeterministic FSM (JE m 72 PE FSM), & 2 


Finite state machine 

non-void function calls ( 非 空 函数 调用 )，320- 
323 

non-volatile memory ( 非 易 失 性 存储 器 )，16 

nonunary trap ( 非 一 元 陷阱 )，480 

NOP instruction (NOP 指令 )，237,487 

NOPn instruction (NOPn 指令 )，237,479-480 

NOR gate (NOR 门 )，586-587 

NOR-NOR circuit (NOR-NOR 电路 )，597 

NOT operation (NOT 运算 )， 参 见 ones’ complement 

number line, for two’s complement binary 

representation (二 进 制 补 码 表示 的 数 轴 )， 
131-133 

Nybble (4 位 字 节 )，474 


O 


object program (目标 程序 )，56 
One shot device ( 单 次 设备 )， 参 见 Monostable 
multivibrator 
Ones’s complement (J243), 125-126 
Opcode (操作 码 )，189，193 
mnemonic for (操作 码 的 助 记 符 )，234 
unimplemented (未 实现 的 操作 码 )，237 
Operand specifier (操作 数 指示 符 )，189，192， 
194, 289 
Operating system (操作 系统 )，19-20 
functions of (操作 系统 的 功能 )，19 
at Level OS4 (OS4 层 的 操作 系统 )，10 
Pep/9, 222-225, 471-472 
processes in (操作 系统 的 进程 )，503-505 
purposes of (操作 系统 的 目标 )，470 
types of (操作 系统 的 类 型 )，470 
vectors ( [HJ #t), 498-501 
operation code (操作 码 )， 参 见 opcode 
OprndSpec, 343-344 
Optimization compiler (优化 编译 器 )，297-298 
advantages and disadvantages of (优化 编译 器 
的 优 和 缺点)，298 
purpose of (优化 编译 器 的 目标 )，298 
OR-AND circuit (OR-AND 电路 )，594-596 
OR gate (OR 门 )，585-587 
Or instruction (Or ##4), 199-200 
organizations, abstraction in (组 织 中 的 抽象 ), 8-9 
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ori instruction, MIPS (ori ##4, MIPS), 754 
OS4, 10 
Overflow bit (溢出 位 )，133-135， 参 见 V bit 


P 


Pac-Man effect (Pac-Man 效应 )，601 
page fault (页 故障 )，545 
page replacement (页 替换 )，546-547 
algorithms (算法 )，547-549 
page table (页 表 )，541 
Paging (分 页 )，540-543 
Parallelism (并 行 )，717 
Parameter (参数 ) 
array( 数 组 参数 )，344-350 
run-time stack for (运行 时 栈 )，348 
translation rules for (数组 参数 的 翻译 规则 )， 
350 
call-by-reference ( 传 引 用 调用 参数 ) 
with global variables ( 带 全 局 变量 的 传 引 用 
调用 参数 )，323-328 
with local variables( 带 局 部 变量 的 传 引用 调 
用 参数 )，329-332 
call-by-value ( 传 值 调用 参数 ) 
with global variables ( 带 全 局 变量 的 传 值 调 
用 参数 )，313-317 
with local variables ( 带 局 部 变量 的 传 值 调用 
参数 )，317-320 
Parity bit (奇偶 位 )，555 
Parser (4} 4a), 392, 455-456 
Characteristics (分 析 器 特性 )，455-456 
direct-code (直接 编码 分 析 器 )，423-426 
multiple-token (多 语言 符号 分 析 器 )，428-435 
recursive descent (递归 下 降 分 析 器 )，456 
table-lookup ( 查 表 分 析 器 )，421-423 
Parsing (分 析 )，420 
problem (分 析 问 题 )，400-401 
Pascal’s triangle (帕斯卡 三 角 )，89 
PC-relative addressing, format for ( PC 相对 寻 址 
格式 )，748 
PCB, 477, 503-505 
Pep/9 computer (Pep/9 计算 机 )，184 
alphabet (字符 表 )，393 
block diagram ( 方 框图 )，185 
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central processing unit (中 央 处 理 单元 )，185 
input/output devices (输入 /输出 设备 )，188 
instruction format (指令 格式 )，189-193 
instruction set at Level ISA3 (ISA3 层 的 指令 
集 )，190 
main memory ( 主 存 )，186-188 
operating system (操作 系统 )，222-225 
programming at Level ISA3 (ISA3 层 的 编程 )， 
225-226 
Pefect code (完美 编码 )，560 
Peripheral Component Interconnect Express 
(PCIe， 外 围 组 件 快速 互 连 )，40 
Peterson’s algorithm, for mutual exclusion 
(Peterson HFA), 512-513 
Pipelining (流水 线 )，760-771 
data forwarding (数据 转发 )，769 
dynamic branch prediction (动态 分 支 预测 )， 
766-767 
hazards (冒险 )，762, 764 
controlling (控制 冒险 )，762, 765 
RAW data (RAW 数据 冒险 )，767-768 
WAR data (WAR 数据 冒险 )，770 
instruction reordering (指令 重 排序 )，768 
MIPS machine (MIPS 机 器 )，760-771 
superscalar machines (超标 量 机 器 )，769-770 
pixels (像素 )，15 
Platform Controller Hub ( PCH, 平台 控制 单元 )， 
40 
Pointers (指针 )，102-104 
as addresses (指针 作 地 址 )，361 
assignment (指针 分 配 )，102 
global (全 局 指针 )，357-363 
local (局 部 指针 )，363-367 
stack ($), #JL SP 
prevention policy, of deadlock( 死 锁 的 预防 策略 )， 
519 
printBar () , 317 
printf () function, translating (翻译 printf() 函数 )， 
263-265 
procedures, definition of (过 程 的 定义 )，72 
Process (进程 ) 
concurrent (并 发 进程 )，501-516 
cooperating (协同 进程 )， 506 
definition of (进程 的 定义 )，477 


Process control block (进程 控制 块 )， 参见 PCB 
process management (进程 管理 ) 
concurrent process (并 发 进程 )，501 
asynchronous interrupt (4 FÉT), 502-503 
critical section (Ili ##XX), 508-509 
multiprocessing (4b), 505-506 
mutual exclusion (4J¥), 509-513 
program (程序 )，506-508 
semaphore (信号 量 )，513-516 
loader (装载 器 )，470 
Pep/9 loader (Pep/9 装载 器 )，472-474 
Pep/9 operating system ( Pep/9 操作 系统 )， 
471-472 
program termination (程序 终止 )，474-475 
trap (BABE), 475 
addressing mode assertion ( 寻 址 方式 断言 )， 
480-482 
handler (处 理 程序 )， 参 见 trap, handler 
mechanism (机 制 )，476-477 
operand address computation (计算 操作 数 地 
址 )，483-486 
RETTR instruction (RETTR 指令 )，477 
processor management ( 处 理 器 管理 )，19 
production (产生 式 ) 
in grammar (语法 的 产生 式 )，397 
recursive (递归 产生 式 )，399 
program (程序 )，506-508 
definition of (程序 的 定义 )，18 
file (Sct), 19 
statements alignment (程序 语句 对 齐 )，724- 
727 
termination (终止 )，474-475 
programmable read-only memory (PROM， 可 编 
程 只 读 存储 器 )，222, 673-674 
programming at Level ISA3 (ISA3 Jz AY 4a #2), 
221-226 
Pep/9 operating system (Pep/9 操作 系统 )，222- 
225 
read-only memory (只 读 存 储 器 )，221-222 
using Pep/9 system (使 用 Pep/9 系统 )，225-226 
pseudodirect addressing, format for ( 伪 直 接 寻 址 
格式 )，748-749 


Q 


QR code (QR #4), 4 quick response codes 


Queries (查询 )，42-45 
relationship with database and result (查询 与 数 
据 库 和 结果 的 关系 )，43 
result of (查询 的 结果 )，42-43 
statements for (查询 语句 )，43-45 
queue of PCB (PCB 队列 )，503-505 
quick response codes (快速 啊 应 码 )，27-32 
alignment and format regions (校准 和 格式 域 )， 
28-30 
alignment patterns (校准 图 形 )，29-30 
dark module( 深 色 模 块 )，29 
finder patterns (探测 图 形 )，28-29 
format information area (格式 信息 区 )，29 
separators (分 隔 符 )，29 
timing patterns (定位 图 形 )，29 
version information area (版 本 信息 区 )，30 
correction levels in (快速 响应 码 中 的 纠 错 级 别 )， 
31-32 
information bits (信息 位 )，30-32 
character count indicator (字符 计数 指示 器 )，31 
data bits (数据 位 )，31-32 
mode indicator (模式 指示 器 )，30-31 
redundant bits of error correction (用 于 纠 错 
的 元 余 码 )，31 


R 


radix, of number system ( 数 制 的 基数 )，122 
RAID storage system (存储 系统 )，562-569 
Level 0:Nonredundant striped (RAID 0 级: 非 
TURAL), 562-563 
Level 1: Mirrored (RAID 1 级 : 21%), 563-564 
Level 2:Memory-style ECC (RAID 2 级 : 内 存 
风格 的 ECC), 566-567 
Level 3:Bit-inteleaved parity (RAID 3 级 : 位 
交叉 奇偶 校 验 )，567-568 
Level 4:Block-inteleaved parity (RAID 4 级 : 
TRAE ML AYRE), 568-569 
Level 5: Block-interleaved distributed parity 
(RAID 5 级 : 块 交叉 分 布 奇 偶 校 验 )，569 
Levels 01 and 10: Striped and mirrored ( RAID 
01 和 10 级 : 条 带 化 和 镜像 )，564-566 
random-access memory ( RAM， 随 机 访问 存储 
ft), 16, 222, 471 


range (范围 ) 
for two’s complement ( 补 码 的 范围 )，128-129 
for unsigned integers (无 符号 整数 的 范围 )， 
123-124 
RAW data hazard (RAW 数据 冒险 )， 参 见 Pipelining 
read-after-write (RAW) hazard (5 Ja i & K), 
767-768 
read enable box ( 读 使 能 方块 )，672-673 
read-only memory ( ROM， 只 读 存储 器 )，221- 
222, 471, 673 
read/write memory (RWM, ix / 写 内 存 )，222 
real-time operating systems (实时 操作 系统 )，470 
recursion (递归 )，81-100 
binomial coefficient function (二 项 式 系数 函数 )， 
89-94 
cost of recursion (递归 的 开销 )，99-100 
elements of array, reversing (逆转 数组 元 素 )， 
94-96 
factorial function (阶乘 函数 )，82-85 
mutual recursion (相互 递归 )，98-99 
recursive addition (递归 加 法 )，87-89 
recursive definition (递归 定义 )，81 
recursive thinking (递归 思维 )，85-86 
Towers of Hanoi ( 汉 诺 塔 )，95-98 
recursive addition (递归 加 法 )，87-89 
recursive definition (递归 定义 )，81 
recursive descent (递归 下 降 )，99 
parser (分 析 器 )，456 
recursive thinking (递归 思维 )，85-86 
divide and conquer strategy (分 治 策略 )，86 
macroscopic viewpoints (宏观 视角 )，85-86 
microscopic viewpoints (微观 视角 )，85-86 
reduced instruction set computer (精简 指令 集 计 
FAL), AIL RISC 
redundant bits of error correction, QR code (用 于 
纠 错 的 元 余 位 ，QR 码 )，31 
register addressing, format for (寄存 器 寻 址 格式 )， 
747 
register sets (寄存 器 组 )，743-744 
register transfer language (寄存 器 传送 语言 )， 参 
见 RTL 
registers (Aff fit), 12, 666-667 
base and bound ( 基 址 和 边界 寄存 器 )，535 
block diagram of (寄存 器 的 方 框图 )，666 
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implementation with D flip-flops (用 DD 触发 器 
实现 寄存 器 )，666-667 
MIPS, 743-744 
Regular expression (正则 表达 式 )，392 
relational database systems (关系 数据 库 系 统 )， 
41-42 
Relational operator (关系 运算 符 )，65 
relations, definition of (关系 的 定义 )，42 
relays( 继 电器)，118 
relocatable loader (可 重 定 位 装载 器 )，534 
Resource allocation graph (资源 分 配 图 )，517-519 
RET instruction (RET 指令 )，315 
RETTR instruction (RETTR 指令 )，477 
return , translating (翻译 return), 264 
RGB stripe (RGB 条 纹 )，35 
ripple-carry adder ( 行 波 进 位 加 法 器 )，614 
RISC, 39, 578 
versus CISC (RISC 与 CISC), 739-741 
ROLr instruction (ROLr #84), 274-275 
RORr instruction (RORr 444), 274-275 
rotate left operation (ROL, (AAC HIRE), 141 
rotate operators (循环 操作 )，141-142 
rotate right operation (ROR ， 循 环 右 移 操 作 )，141 
round to nearest, ties to even rule (就 近 舍 人 ， 对 
HUB), 158-159 
RTL, 138-139, 289, 476 
operations and symbols (操作 与 符号 )，138 
specification (说 明 ) 
add instruction (加 法 指令 )，197 
arithmetic shift left operation (算术 左 移 操 
Ye), 140 
exclusive OR operation (XOR 操作 )，139 
and instruction (AND 指令 )，199 
or instruction (OR #84), 199 
invert instruction ( 取 反 指令 )，200 
load byte instruction ( 字 节 装 人 指令 )，202 
load word instruction ( 字 装 入 指令 )，194 
negate instruction ( 取 负 指令 )，201 
rotate left operation (循环 左 移 操 作 )，141 
rotate right operation (循环 右 移 操 作 )，141 
store byte instruction ( 字 节 存储 指令 )，202 
store word instruction ( 字 存 储 指令 )，196 
subtract instruction (减法 指令 )，198 
run command (运行 命令 )，56 


run-time stack (运行 时 栈 )，290-292 
alignment on (运行 时 栈 上 的 对 齐 )，724 
for call-by-reference parameter ( 传 引用 调用 参 
数 的 运行 时 栈 ) 
with global variable( 带 全 局 变量 的 传 引用 
调用 参数 的 运行 时 栈 )，328 
with local variable ( 带 局 部 变量 的 传 引用 调 
用 参数 的 运行 时 栈 )，332 
for parameter arrays (人 参数 数组 的 运行 时 栈 )， 
348 


S 


Seek time ( 寻 道 时 间 )，16，551 
selective inverter gate (选择 反 相 器 门 )，610 
Semantics (语义 )，392 
Semaphore (信号 量 )，513-516 
critical sections with( 带 信号 量 的 临界 区 )，516 
separators, QR code (分 隔 符 ，QR 码 )，29 
sequential access memory (顺序 访问 存储 器 )，16 
sequential circuits (时 序 电 路 )，637-682 
computer subsystems (计算 机 子 系统 )，666- 
682 
address decoding (地 址 译 码 )，674-680 
buses (总 线 )，667-669 
memory subsystems ( 4 fif a T AHL), 669- 
674 
registers (寄存 器 )，666-667 
two-port register bank ( 双 端 口 寄存 器 体 )， 
680-682 
latches and clocked flip-flops ( 锁 存 器 与 时 钟 触 
发 器 )，641-656 
clocked SR flip-flop (时 钟 SR 触发 器 )，641- 
643 
D flip-flop (D LEZE), 653-654 
excitation tables (激励 表 )，655 
JK flip-flop (JK fhA#t), 650-653 
master-slave SR flip-flop(  - 从 SR 触发 器 )， 
643-648 
SR latch (SR i7¢ #4), 639-641 
T flip-flop (T kÆ Ak), 654-655 
preset and clear ( 预 设置 与 清除 )，661 
sequential analysis (时 序 分 析 )，656-661 
sequential design (时 序 设计 )，656-665 


Serial Advanced Technology Attachment ( SATA, 
串 行 高 级 技术 连接 )，40 
set-associative cache (组 相 联 高 速 缓存 )，734- 
736 
Set, bit-mapped represention of (集合 ， 位 图 表 
示 )，481-482 
Set interpretation of boolean algebra (布尔 代数 的 
集合 表示 )，587-588 
set theory interpretation (集合 论 表示 方式 )，587- 
588 
signed integer (有 符号 整数 ) 
grammar for (有 符号 整数 的 语法 )，398-399 
structure of (有 符号 整数 的 结构 )，126 
significand (尾数 )，156 
single-error-correcting codes (纠正 一 位 错误 编 
码 )，559-562 
single-user operating systems (AAP SRE RZ), 
470 
sll instruction, MIPS (sll #84, MIPS), 753 
software (软件 )，17-22 
analysis and design (分 析 和 设计 )，20-22 
applications software (应 用 程序 软件 )，18-19 
distribution (销售 ) 
advantage of object code for (目标 程序 对 软 
件 销售 的 好 处 )，256 
advantage of source code for ( 源 程序 对 软件 
销售 的 好 处 )，256 
interrupt (Wr), 501 
operating systems (操作 系统 )，19-20 
systems software (系统 软件 )，18-19 
solid-state disks (SSD， 固 态 磁盘 )，17 
source program ( 源 程序 )，56 
Space/time tradeoff (空间 /时间 折 中 )，716 
combinational circuits (组 合 电路 )，595，609 
Exercise 10.46 (练习 10.46 )，633 
Spaghetti code (面条 代码 )，305-307 
spatial locality (空间 局 部 性 )，730 
special values, in floating-point representation ( 浮 
点 数 表示 的 特殊 值 )，159-165 
Specialized hardware unit, MIPs (特殊 的 硬件 单 
元 ，MIP)，755，757 
Spin lock (旋转 锁 )，514 
SR latch (SR 锁 存 器 )，639-641 
stable state, in feedback circuits (反馈 电路 中 的 稳 
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Æ), 638 
stack-deferred indexed addressing ( 栈 间 接 变 址 寻 
tit), 349, ÆJ addressing modes 
stack frame ( 栈 帧 )，75 
stack-indexed addressing ( 栈 变 址 寻 址 )，343， 
参见 addressing modes 
deferred (ii]#), 349-350, 376-377 
stack pointer (SP， 栈 指针 ) 
before and after program executes (程序 执行 前 
后 的 栈 指 针 )，291-292 
as memory address〈 栈 指针 作 内 存 地 址 )，289 
stack-relative addressing( 栈 相对 寻 址 )，289- 
292，486， 参见 addressing modes 
deferred( 间 接 )，327-328，332，366-367 
run-time stack (运行 时 栈 )，290-292 
start symbol (开始 符号 )，396 
state registers (状态 寄存 器 )，656 
State transition diagram (状态 转换 图 )，408-409 
State transition table (状态 转换 表 )，409-410， 
412-413 
state variable (状态 变量 )，421 
static memory (SRAM ， 静 态 存储 器 )，673 
Stop instruction (停止 指令 )，194 
storage management (存储 管理 )，532 
error-detecting and error-correcting codes( 检 错 
纠 错 码 ) 
code requirements (编码 需求 )，556-559 
error-detecting codes ( 检 错 码 )，556-557 
single-error-correcting codes (一 位 纠 错 码 )， 
559-562 
file management (文件 管理 )，549-550 
allocation techniques (分 配 技 术 )，552-554 
disk drives (磁盘 驱动 )，550-551 
file abstraction (文件 抽象 )，551 
memory allocation (内 存 分 配 )，532 
fixed-partition multiprogramming (固定 分 区 
多 道 程序 设计 )，533-534 
logical addresses (逻辑 地 址 )，534-537 
paging (分 页 )，540-543 
uniprogramming ( 单 道 程序 设计 )，532-533 
variable-partition multiprogramming (可 变 分 
区 多 道 程 序 设 计 )，537-540 
RAID storage systems (RAID 存储 系统 )，562- 
569 
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level 0: nonredundant striped ( 0 级 : JETA 
条 带 化 )，562-563 
level 1: mirrored (1 级 : 1%), 563-564 
level 2: memory-style ECC (2 级 : 内 存 风 格 
的 错误 校 验 码 )，566-567 
level 3: bit-interleaved parity (3 级 : 位 交叉 
奇偶 校 验 )，567-568 
level 4: block-interleaved parity (4 级 : 块 交 
叉 奇 偶 校 验 )，568-569 
level 5: block-interleaved distributed parity ( 5 
级 : 块 交叉 分 布 奇偶 校 验 )，569 
levels 01 and 10: striped and mirrored ( 01 级 
和 10 级 : 条 带 化 和 镜像 )，564-566 
virtual memory (虚拟 存储 器 ) 
demand paging ( 按 需 分 页 )，545-546 
large program behavior (大 型 程序 的 行为 )， 
543 
page replacement ( HH), 546-547 
page-replacement algorithms (页 蔡 换 算法 )， 
547-549 
virtual memory (虚拟 存储 器 )，544-545 
Store byte instruction( 字 节 存 储 指令 )，202-203 
Direct (直接 )，703-704 
store word instruction ( 字 存 储 指令 )，196 
direct (直接 )，706-707 
STRO instruction ( STRO 指令 )，237，251-252， 
482, 498-501 
structured flow of control (结构 化 控制 流 )，307 
Structured programming theorem (结构 化 编程 定 
律 )，8，308-309 
Structured Query Language ( SQL， 结 构 化 查询 
语言 )，43 
Stucture (结构 )，104-105 
Global (全 局 结构 )，367-372 
linked data ( 链 式 数据 结构 )，372-377 
local (局 部 结构 )，371-372 
SUBSP instruction (SUBSP 指令 )，289，292 
Subtract instruction (减法 指令 )，198-199 
Subtracter (WARE), AIL Adder/subtracter 
Subtraction, binary (减法 ， 二 进 制 )，621-624 
Superscalar machines (超标 量 机 器 )，769-770， 
参见 Pipelining 
Supervisor call (管理 程序 调用 )，501 
sw instruction (sw 指令 ),，MIPS, 751, 759-760 


switch statement (switch if] ), 67-68, 350-354 
symbol (#45), 257-261, 266 
program with ( 带 符号 的 程序 )，258-260 
trace tags (跟踪 标签 )，273, 294 
tracer (跟踪 器 )，273-274 
von Neumann illustration (75 + 诺 依 曼 示例 )， 
260-261 
Symbol trace tags (ff SIRER SE), AIL Trace 
tag 
synchronous interrupt (同步 中 断 )，501 
Syntax (语法 )，392 
techniques to specify (句法 说 明 的 技术 )，392 
tree (语法 树 )，402 
for parse of nonterminal alphabet ( 非 终 结 符 
句法 分 析 的 语法 树 ) 407 
system bus (系统 总 线 )，12 
system performance equation (系统 性 能 公式 )， 
25-26,738-739 
systems software (系统 软件 )，18-19 


T 


T flip-flop (T 触发 器 )，654-655 
block diagram of (T 触发 器 的 方 框图 )，655 
characteristic table for (了 T 触 发 器 的 特征 表 )， 
655 
table-lookup parser (ÆRA), 421-423 
Teletype Model 33, 148 
temporal locality (时 间 局 部 性 )，730 
three-variable Karnaugh maps (三 变量 卡 诺 图 )， 
599-604 
threshold, of gate (/ JA MU{AL), 645-646 
Time out (AT), 502 
time sharing (分 时 )，502 
Timing diagram (时 序 图 ) 
of clocked SR flip-flop ( 钟 控 SR 触发 器 时 序 
图 )，643 
of D flip-flop (D 触发 器 时 序 图 )，653 
of master-slave SR flip-flop (EM SR 触发 器 时 
序 图 )，647 
for SR latch (SR 锁 存 器 时 序 图 )，641 
of von Neumann cycle (75 + 诺 依 曼 周 期 的 时 
序 图 )，699 
timing patterns, QR code (定位 图 形 ，QR 码 )，29 


token, definition of (语言 符号 的 定义 )，415 
Towers of Hanoi ( 汉 诺 塔 )，95-98 
Trace tags (跟踪 标签 )，273 
format (格式 跟踪 标签 )，273，294，339 
symbol (符号 跟踪 标签 )，273，294 
Transmission time (传送 时 间 )，551 
Trap (KBE), 475 
handlers (陷阱 处 理 程序 ) 
DECI, 408-414 
DECO, 414-417 
HEXO and STRO ( HEXO 和 STRO ), 498- 
501 
no-operation (无 操作 )，487 
mechanism (陷阱 机 制 )，476-477 
nonunary ( 非 一 元 )，480 
Pep/9, 476 
tree diagram ( 树 形 图 )， 参 见 hierarchy diagrams 
Tri-state buffer (三 态 缓冲 区 )，668-669 
Truth table ( 真 值 表 )，580，588 
and boolean expression( 真 值 表 和 布尔 表达 式 )， 
591-593 
tuples, definition of (定义 三 元 组 )，42 
Two-level circuit (两 级 电路 )，593-595 
two-port register bank ( 双 端 口 寄存 器 体 )，680- 
682 
Two’s complement binary representation ( 补 码 二 
进 制 表示 )，125-126 
base conversions (基数 转换 )，130-131 
negative and zero bits (负数 和 零 位 )，135-136 
number line ( 数 轴 )，131-133 
overflow bit (溢出 位 )，133-135 
range for ( 补 码 二 进 制 表示 范围 )，128-129 
Type compatibility (类 型 兼容 )，271-272 
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ubiquitous NAND (无 处 不 在 的 NAND)，595-597 

unary instruction (一 元 指令 )，189 

unary operation (一 元 操作 )，138 

Unicode character (Unicode 字符 )，149-153 

Unicode Transformation Format ( UTF, Unicode 
转换 格式 )，150-153 

unidirectional buses ( 单 向 总 线 )，667 

Unified Modeling Language ( UML ,统一 建 模 语 
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=Æ), 439-442 
unimplemented opcode (未 实现 的 操作 码 )， 参 见 
opcode 
uniprogramming ( 单 道 程序 设计 )，532-533 
Universal Serial Bus (USB ， 通 用 串 行 总 线 )，40 
unsigned addition (无 符号 数 加 法 )，124-125 
unsigned binary representation (无 符号 二 进 制 表 
7R), 118-125 
base conversion (基数 转换 )，121-123 
binary storage (二 进 制 存储 )，118-119 
carry bit (进位 位 )，125 
integer (整数 )，119-121 
range for unsigned integer (无 符号 整数 的 范 
围 )，123-124 
unsigned addition (无 符号 数 加 法 )，124-125 
unstable state, in feedback circuits (反馈 电路 的 
非 稳 态 )，638 
user stack (用 户 栈 )，223 
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V bit (V fiz), 134-135, 614-615, 712-713 
variable-partition multiprogramming (可 变 分 区 多 
道 程序 设计 )，537-540 
variables (变量 )，56-65 
attributes of (变量 的 属性 )，59 
C compiler (C 编译 器 )，56-57 
C memory model (C 语言 内 存 模型 )，57-59 
Global (全 局 变量 )，267-271 
and assignment statements (全 局 变量 和 赋值 
语句 )，59-62 
call-by-reference parameters with ( 带 全 局 变 
量 的 传 引 用 调用 参数 )，323-328 
call-by-value parameters with ( 带 全 局 变量 
的 传 值 调用 参数 )，313-317 
local (局 部 变量 )，62-65，292-294 
call-by-reference parameters with ( 带 局 部 变 
量 的 传 引 用 调用 参数 )，329-332 
call-by-value parameters with ( 带 局 部 变量 
的 传 值 调用 参数 )，317-320 
machine independence (机 器 无 关 性 )，57 
types (类 型 )，266 
version information area, QR code (版 本 信息 区 ， 
QR 码 )，30 
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virtual computer (虚拟 计算 机 )，184 
virtual memory (虚拟 内 存 )，544-545 
demand paging ( 按 需 分 页 )，545-546 
large program behavior (大 型 程序 的 行为 )， 
543 
page replacement ( if (ii ##4%), 546-547 
algorithms ($74), 547-549 
void function (43 PRX), 72-75 
actual parameter (X), 75 
allocation process for ( 空 函 数 的 分 配 过 程 )，74 
deallocation process for ( 空 国 数 的 释放 过 程 )， 
75 
formal parameter (22), 75 
stack frame (fii), 75 
volatile memory( 易 失 性 存储 器 )，16，222 
von Neumann execution cycle (75 - 诺 依 曼 执 行 
周期 )，206-208，641，696-703 
MIPS，744 
Pep/9 at Level ISA3 ( ISA3 层 的 Pep/9 ), 250, 


312-313 
symbol and (#45 ALB - 诺 依 曼 执 行 周 期 )， 
260-261 
von Neumann machines (15 + 诺 依 曼 机 器 )，206- 
220 


bugs (imi), 214 

character input program (字符 输入 程序 )，214- 
216 

character output program (字符 输出 程序 )， 
208-214 

decimal to ASCII conversion (十 进 制 到 ASCII 
码 的 转换 )，216-217 

execution cycle (执行 周期 )，206-208 


self-modifying program (自我 修改 程序 )，217- 
220 


W 


WAR data hazard (数据 冒险 )， 参 见 Pipelining 

Watson, Thomas J., 118 

while loop (while #834), 68-69, 300-302 

wired-OR property (2% -OR JATE), 668 

WORD pseudo-op (.WORD HIRE), 238, 242- 
244 

Working set (工作 集 )，543 

write-after-read (WAR) hazard ( 读 后 写 冒 险 )， 
770 


x86 
architecture (x86 3244), 219-220 
assembly language (x86 汇编 语言 )，261-262 
compiling to (编译 为 x86 汇编 语言 )，354- 
356 
microcode in systems ( x86 # Zt P AY i 73), 
742 
XOR gate (XOR J), 587 
XOR operator (XOR 运算 符 )，335-336 
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Z bit (Z fiZ), 135-136, 618, 694-695 

Zero bit (F44), AM Z bit 

Zero theorem (4 Jt Æ FH), 583, 4 JL Boolean 
algebra 
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